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10 

Titel: Rekonfigurierbare Elemente 

15 



Definitionen 

20 Rekonfigurierbare Elemente werden abhangig von der auszufuhrenden Applikation 
unterschiedlich und applikationsentsprechend ausgestaltet. 

Die Aufgabe der Erfindung besteht darin, Neues fur die gewerbliche Anwendung 
berei tzustellen . 

25 

Die Ltisung der Aufgabe wird unabhangig beansprucht. Bevorzugte 
Aus f tthrung s f ormen finden sich in den unteranspruchen . 

Unter einer rekonf igurierbaren Architektur werden vorliegend Bausteine (VPD) 
30 mit konf igurierbarer Funktion und/oder Vernetzung verstanden, insbesondere 
integrierte Bausteine mit einer Mehrzahl von ein- Oder mehrdimensional 
angeordneten arithmetischen iind/oder logischen und/oder analog en und/oder 
speichernden und/oder intern/extern veraetzenden Baugruppen, die direkt Oder 
durch ein Bus system miteinander verbunden sind. . 

35 

Zur Gattung dieser Bausteine zahlen insbesondere systolische Arrays, 
neuronale Netze, Mehrprozessor Systeme, Prozessoren mit mehreren Rechenwerken 
und/oder logischen Zellen und/oder kommunikativen/peripheren Zellen (IO), 
Vernetzungs- und Netzwerkbausteine wie z.B. Crossbar-Schalter, ebenso wie 
40 bekannte Bausteine der Gattung FPGA, DPGA, Chameleon, XPUTER, etc.. 

Hingewiesen wird insbesondere in diesem Zusammenhang auf die folgenden 
Schutzrechte und Anmeldungen desselben Anmelders: 

P 44 16 881.0-53, DE 197 81 412.3, DE 197 81 483.2, DE 196 54 846.2-53, 
DE 196 54 593.5-53, DE 197 04 044.6-53, DE 198 80 129.7, DE 198 61 088.2-53, 
45 DE 199 80 312.9, PCT/DE 00/01869, DE 100 36 627.9-33, DE 100 28 397.7, 

DE 101 10 530.4, DE 101 11 014.6, PCT/EP 00/10516, EP 01 102 674.7, DE 196 51 
075.9-53 , DE 196 54 846.2-53, DE 196 54 593.5-53 , DE 197 04 728.9, DE 198 
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07 872.2 , DE 101 39 170.6 , DB 199 26 538.0 , DE 101 42 904.5 , , DE 102 06 

653.1 , DE 102 06 857.7 , DE 100 28 397.7 , DE 101 10 530.4 , DB 102 02 

044.2 , DE 101 29 237.6-53 , DB 101 42 904.5 , DE 100 50 442.6 , DE 101 35 
210.7-53 , BP 02 001 331.4 , 60/317,876 .Diese sind hiermit. zu 

5 Offenbarungszwecken vollumfanglich eingegliedert. 

Die o.g. Architektur wird beispielhaft zur Verdeutlichung herangezogen und im 
folgenden VPU genannt. Die Architektur besteht aus beliebigen arithmetischen, 
logischen (auch Speicher) und/oder Speicherzellen und/oder Vernetzungszellen 

10 und/oder kommuiiikativen/peripheren (10) .Zellen (PAEs), die zu einer ein- Oder 
mehrdimensionalen Matrix (PA) angeordnet sein kttnnen, wobei die Matrix 
unterschiedliche, beliebig ausgestaltete Zellen aufweisen kann; auch die 
Bussysteme werden dabei als Zellen verstanden. Der Matrix als ganzes Oder 
Teilen davon zugeordnet ist eine Konf igurationseinheit (CT, Ladelogik) , die 

15 die Vernetzung und Funktion des PA konf iguriert . Die CT kann z. B. als 

dedizierte Einheit gem. PACT05, PACT10, PACT17 , ausgestaltet sein oder als 
Host-Mikroprozessor nach P 44 16 881.0-53 , DE 102 06 856.9 dem PA 
zugeordnet bzw. mit oder durch solche realisiert sein. 

20 

Stand der Technik 

Unterschiedliche PAE-Strukturen sind nach dem Stand der Technik bekannt. Die 
gebrauchlichsten sind durch DE 196 51 075.9-53 , DE 100 50 442.6 , sowie 
25 Chameleon CS2112 definiert. Weiterhin soil auf die bekannten FPGA-Zellen 
verwiesen werden. 

Aus dem universitaren Hmfeld sind Zellstrukturen wie die DPGAs, RawMachine 
(DeHuon) , KressArrays (Kress, Uni Kaiserslautem) , XPDTER (Hartenstein, Uni 
30 Kaiserslautem), sowie weitere Strukturen bekannt. 

Die nachfolgend beschriebenen Erweiterungen, die f Or alle vorgenannten 
Strukturen nutzbar sind, verbessern die Nutzbarkeit der Architekturen und 
PAE-Strukturen in komplexen insbesondere auch stark sequent! ellen und/oder 
35 wenig datenflufiorientierten Anwendungen. Weiterhin wird der Anschlufi an 
ex tern e Einheiten (z.B. Speicher und/oder Peripherie) vereinfacht und 
homogeni sier t . 

40 

Indirekte Konf iguration 

In einer besonderen Ausftthrung einer PAE (IPAE) wird diese oder eine Gruppe 
von PAEs mit einem Speicher (RRAM) , vorzugsweise einer RAM- PAE gekoppelt. Die 
IPAE weist einen eigenen internen Sequenzer auf oder ist mit einem Sequenzer 
45 bzw. Microcontroller mit einem bevorzugt limi tier ten, d.h. mit einer 

vergleichsweise geringen Anzahl an unterschiedlichen mdglichen Befehlen, 
ahnlich wie bei RlSC-Prozessozren und/oder bevorzugt vollstandigen 
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Befehlssatz (vgl. ARC Microprocessor) gekoppelt. Mit anderen Worten wird 
bevorzugt ein RISC Prozessor mit einem mfiglichst kleinen Befehlssatz , der 
jedoch berechnungstheoretisch vollstSndig ist, verwendet. In einer 
Ausfuhrungsvariante kann der Sequenzer auch durch eine Konf iguration einer 
5 Oder mehrerer PAEs gebildet werden. Es kann der Sequenzer in seiner Funktion 
und seinem Ablaufverhalten konf igurierbar ausgestaltet sein (wie 
beispielsweise nach dem Stand der Technik bekannt, z.B. durch EPS448 von 
Altera (ALTERA Data Book 1993]). Der Sequenzer /Microcontroller kann auf 
Zustande (z.B. Statussignale, Ereignisse) in der IPAE und/oder auf Zustande 

10 . (z.B. auch Trigger) anderer PAEs, die mit der IPAE verbunden sind (z.B. uber 
ein Bussystem) , reagieren. In einem Register der IPAE wird ein Pointer auf 
einen RRAM Speicherinhalt konfiguriert, z. B. kann der ProgramPointer Rpp 
kann wahrend des Reset-Zyklus auf die Startadresse des Codes gesetzt werden. 
Ein Adressgenerator im Sequenzer liest den durch den Pointer referenzierten 

15 Speicherinhalt aus dem RRAM und schreibt dies en (oder einen Teil des sen) 
entweder in ein, beispielsweise durch den Speicherinhalt adressiertes, 
Konf igurationsregister einer adressierten PAE oder nutzt den Speicherinhalt 
als Instruktion fur eine nachste Verarbeitung. Der Pointer wird durch den 
Adressgenerator entsprechend der Oblichen Arbeitsweise von Adresspointern 

20 inkrementiert und/oder dekrementiert und/oder bei Sprungbefehlen (JUMP, CALL, 
RETURN) neu gesetzt. Insoweit stellt der Speicher RRAM einen Codespeicher und 
in einer bevorzugten Ausfuhrung auch Datenspeicher fur einen Sequenzer zur 
Verfugung und/oder wird als solcher genutzt. Der Sequenzer kann frei Code aus 
dem Speicher (RRAM) lesen und in einer bevorzugten Ausfuhrung auch Da ten aus 

25 dem Speicher lesen oder in den Speicher schreiben. Insofern stellt der 
Speicher auch einen Datenspeicher fur den Sequenzer dar. 

Der RRAM Speicherinhalt kann von einer ubergeordneten Konf igurationseinheit 
(CT) geladen werden. In einer erweiterten Ausfuhrung kann der Speicherinhalt, 
30 ggf ♦ auch von der IPAE selbstandig, zusatzlich oder alternativ aus einem 

anderen (beispielsweise externen) Speicher geladen oder an diesen geschrieben 
werden, z.B. uber einen Anschlufi an ein Frontend. 

In einer Ausftthrungsvariante kann der Speicher und/oder die IPAE einen 
35 direkten AnschluS (EXTBUS) an ein ext ernes RAM und/oder exteme IO besitzen. 
In einer dabei besonders bevorzugten Ausgestaltung kann der EXTBUS uber eine, 
ggf. dedizierte, Verbindung des PAE-Bus systems an eine Interface-Baugruppe 
(IOAG) wie beispielsweise aus PACT03 oder PACT15 bekannt realisiert sein. Die 
Ansteuerung von Speicher (RAM) und/oder Peripherie (10) erfolgt dabei 
40 bevorzugt durch die Interface-Baugruppe. 

In einer besonders bevorzugten Ausgestaltung kann der RRAM selbstandig Code 
und/oder Daten fur den Sequenzer uber den EXTBUS aus dem oder einem externen 
RAM laden. Diese Funktion kann durch eigenstandige, im RRAM implement ierte 
45 oder implementierbare Adressgenerator en realisiert werden. Beispielsweise 

eignen sich EMA-Kontroller besonders far diese Aufgabe, indem sie blockweise 
Daten zwischen den Speichern kopieren. Der Adressraum der zu lesenden Daten 
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und der Zieladressraum wird entsprechend gesetzt und der Kopiervorgang wird 
gestartet. Das Setzen kanh durch die" IPAE erfolgen. 

In einer hardwar ema&i g aufweridigeren Lfisuhg kann die Function durch eine 
5 implementierte MemoryManagemenUnit (MMU) realisiert sein, der en allgemeine 
Funktionsweise durch den Stand der Technik per se definiert und bekannt ist. 
Vorliegend arbeitet die bevorzugte MMCJ hier wie folgt: 

Der von der MMO" verwaltete RRAM Speicher ist in mehrere Seiten <Pages> 
10 aufgeteilt. Jede Page enthalt Daten eines virtuell en Speicherraumes innerhalb 
eines externen Speichers. Bei spiel sweise kSnnen die hexadezimalen RRAM- 
Adressen OxOaOO . . OxOaf f Daten des externen Speichers an den Adressen 
0xbdl3200. .0xbdl32ff en thai ten. Zur Verwaltung der Adressumsetzung wird eine 
AdressQbersetzungseinheit verwendet, die vorzugsweise durch in der RRAM-Zelle 
15 vorgesehene Lookup-Tabelleh realisiert ist. Die MMO ist nun dazu 

vorgesehen,insbesondere einen gro&en Speicherraum auf den sehr viel 
Kleineren des RRAM zu ttbersetzen. Dies geschieht vorliegend der art, dass 
Seiten je nach Bedarf von dem gro&en Speicherraum in den Kleinen kopiert 
werden. Sobald eine Seite nicht mehr benOtigt wird, kann diese gelSscht 
20 und /oder uberschrieben werden. Wenn die Daten auf der Seite verandert wurden, 
wird die Seite bevorzugt vor dem LOschen/Oberschreiben in den groSen 
Speicherrraum zuruckgeschrieben. 

Die Adressumsetzungseinheit arbeitet dann derart, dass ein hSherwertiger Teil 
25 der physikalischen Adresse (also die Adresse der Seite) in dem Lookup- 

Speicher abgelegt wird und auf die entsprechenden Daten der Seite im RRAM 

zeigt, sobald die Seite innerhalb des kleinen Speichers (RRAM) verfugbar ist. 

Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM, ist 

auch keine Refer enz eingetragen. In diesem Fall muss die Seite erst von 
30 einem grofien (externen) Speicherraum in den RRAM kopiert werden. Hierzu kann 

eine andere, bevorzugt aktuell nicht verwendete Seite gemafi dem vorstehenden 

Ablauf uberschrieberi werden. 

Das Kopieren kann dabei automatisiert, also ohne wesentliche Beteiligung 
35 durch den Sequenzer erfolgen, indem von der MMCJ ein DMA-Kontr oiler 

angesteuert wird. Die erf indungsgemafie MMCT des hier offenbarten RRAM ist 
daher mit einer Ansteuerung fur einen DMA-Kontroller versehen und/ oder 
verbindbar. Diesem werden die entsprechenden Seitenadressen im RRAM und 
externen RAM, sowie die SeitengrBSe durch die MMCJ zur VerfUgung gestellt, z. 
40 B. indem sie in Register eingetragen werden. 

In einer mSglichen und applikationsabhangig ggf . bevorzugten Ausfuhrung 
kOnnen mehrere EXTEUS -Interface implementiert sein. 

45 

In einer mOglichen Ausfuhrung ist der RRAM in mehrere Segmente unterteilt, 
die in unterschiedlichen Adressbereichen liegen. Die Segmente kdnnen 

4 
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beispielsweise fur einige der f olgenden Funktionen aufgeteilt sein bzw. 
aufteilbar sein und insbesondere eine GrdBe aufweiseh, die. die 
Implementierung aller oder einiger der f olgenden Funktionen ermBglicht sowie 
entsprechende Steuerungen, die gegebenenf alls kohf igurierbar sind, bevorzugt 
5 aber fest implementiert sind, besitzen: 

Seguenzer- /Code- Speicher , Stack (z.B. fur Regis tersatz) , Datenspeicher, Heap, 
IO-Puffer, Puffer zu extemem RAM bzw. Cache, Lookup-Tabellen, 
Konfigurationen fur PAEs und/ oder Busse, der Regis tersatz der IPAE. 
Je nach Funktion kdnnen dazu folgende Ansteuermechanismen vorgesehen und/ oder 
10 konfiguriert sein; 

Sequenzer- /Code- Speicher: Programmz eiger auf die entsprechenden 
Speicherstellen (Rpp) . 

Stack: Stackzeiger auf die oberste Speicherstelle des Stack (Rspj , 
gegebenenf alls auch ein FramePointer (Rfp) , wie er nach dem Stand der Technik 
15 (z. B. Intel Pentium) per se bekannt isti 

Konfigurationen fur PAEs und/oder Busse: Hierauf kann ein Zeiger innerhalb 
der CT und/oder - implement ierungsabhangig ein Zeiger innerhalb der 
Konfigurationssteuerung der PAE zeigen. 

Registersatz der IPAE: Sollte der Registersatz der PAE im Speicher 
20 untergebracht sein, wird dieser direkt durch die PAE bevorzugt 
hardwaretechnisch fest vorgegebenen adressiert. 

Die restlichen Speicherbereiche, wie Datenspeicher, Puffer, Tabellen etc. 
werden typischerweise und bevorzugt durch den Compiler oder Programmierer 
25 aufgebaut. Die Adressierung dieser Bereiche erfolgt durch das auszuftthrende 
Programm und/oder Be tri ebssys tern und wird innerhalb des Programmes und/oder 
Be triebs systems , ggf . unter Zuhilf enahme der Regis tersatzes und der ALU des 
Sequenzers, berechnet. 

30 Der Registersatz der IPAB kann in .einer besonderen Ausgestaltung Shnlich dem 
Registersatz von Transputem als Stack organisiert sein. badurch kann der 
Registersatz besonders klein und hardwaretechnisch efficient realisiert 
werden (typischerweise reichen 3 Register A, B und C aus) . Weiterhin ist aus 
der Transputer technologic bekannt, dass Compiler ef fizient mit einem 

35 derartigen hardwaretechnisch kostengunstigen Registersatz arbeiten kSnnen . 
Eben falls kann der Registersatz optional im RRAM liegen. 

In einer Ausfuhrung kann und wird der RRAM als Multi-Port Speicher ausgefOhrt 
sein. Multi-Port Speicher erlauben den ggf. auch gleichzeitigen Schreib- 
40 und/oder Lese-Zugrif f durch mehrere Speicher zugr if fseinheiten auf den 
Speicherinhalt . Speicher zugr if fseinheiten kttnnen beispielsweise externa 
und/oder interne Peripherie, Prozessoren, andere PAEs sein. Die Funktion von 
Multi-Port Speichern ist nach dem Stand der Technik ebenfalls bekannt. 

45 In einer besonderen Ausfuhrung kann die IPAE mit dem RRAM als lokale und ggf. 
auch global e Konfigurationseinheit ahnlich einer CT fur PAEs in der Umgebung . 
arbeiten oder unter anderem diese Funktion mit erf alien. Bevorzugt arbeitet 
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die PAE nach dem aus DE 196 54 846.2-53 bekannten Verfahren bei der 
Verwendung . als lokal Konf igurat ions einheit. Wird die PAE als glbbale 
Konfigurationseinheit verwendet, Oder sind sehr viele ? lokale PAEs zu 
konf igurieren, wird bevorzugt das Verfahren nach DE 196 54 593.5-53 
5 verwendet, das eine FILMO-Funktionalitat aufweist und daher sehr viele und 
auch voneinander unabhangige Konf igurationen verwalten kann. 
Die IPAE adressiert, z. B. gesteuert durch den Sequenzer/ Microcontroller, 
Konf igurationen im RRAM und konf iguriert diese an PAEs und/oder sich selbst 
und/oder bestimmt den Ablauf des Sequenzer s /Microcontrollers. Bevorzugt 

10 findet hierbei eine Synchronisation mit einer ubergeordneten CT ahnlich der 
bekannte Inter -CT-Protokolle <DE 198 07 872.2, DE 100 28 397.7 , DE 199 26 
538.0 ) statt. Die IPAE RRAM Schaltung kann Konf iguration tlber eines der 
EXTRAM- Interface selbst laden und/oder Konfigurationen von einer 
ubergeordneten CT fiber das CT Interface anf ordem . Die Funktionsweise kann 

15 ahnlich der Rekonfigurationseinheit in DE 196 54 846.2-53 sein. Die 
Konfigurationsdaten fur die PAEs warden durch die IRAM an die PAEs 
weitergeleitet Oder in einer bevorzugten Ausgestaltung direkt von RRAM. Zur 
Auf teilung der Daten im RRAM an mehrere PAEs kann dabei ein 
Busverteilverfahren ahnlich des in DE 101 10 530.4 beschriebenen SIMD- 

20 Bussys terns verwendet werden. 

Mit anderen Worten ist die prinzipielle Arbeitsweise einer IPAE RRAM 
Verschaltung ahnlich einem Microcontrollersy-stem, des sen Busanbindung 
und/oder dessen Daten transfer und/oder des sen Prograramablauf einem VPU- System 
25 entspricht . 

Es wird insbesondere Schutz ftir I PAE-RRAM-Ver schal tungen beansprucht, bei 
denen die IPAE und das RRAM jeweils als separate Funktionselemente (PAEs) 
eines rekonfigurierbaren Bausteins ausgestaltet sind und typischerweise 
30 beliebige Vers chal tungen und Funktionen ausftkhren konnen, aber jedoch 

speziell zum Einsatz der erf indungsgemafi beschriebenen Sequenzerstruktur aus 
IPAE und RRAM entsprechend konf iguriert und verwendet werden kdnnen. Die 
Konf iguration erfolgt dabei bevorzugt durch die tibergeordnete 
Konfigurationseinheit CT. 

35 

Ebenfalls wird Schutz beansprucht fur PAEs, die zusatzlich zu ihrem Anschluss 
an die interaen Bussys teme des Arrays aus PAEs einen dedizierten Anschluss 
(IO-Channel) an ein Oberregionales Bus system aufweisen, das insbesondere 
Daten fiber lange Strecken innerhalb des Arrays Obertragt und/oder 

40 insbesondere direkten Anschlufi an die Peripherie aufweist. Der Anschlufi an 
die Peripherie kann dabei direkt erfolgen, indem z. B. das Bussystem bereits 
dem peripheren Protokoll entspricht Oder tlber entsprechende Protokollwandler 
zur Dmsetzung des Protokolls erfolgen. Das dedizierte Bussystem kann dabei 
bereits einem Industriestandard entsprechen, z. B. PCI, RapidIO, Firewire, 

45 USB, Ethernet, RAMBUS, DDR- RAM etc. urn somit einen einfachen und 

unaufwendigen Anschluss der peripheren Gerate zu ermoglichen. Qegebenenfalls 
kOnnen auch in zwischengeschalteten IOAGs (vgl. DE 196 54 595.1-53 ) 
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Protokollkonvertierungen derart durchgeftthrt werden, so dass ein internes 
vereihfachtes und ggf - proprietares Buspfotokbll auf ein oder mehrere 
komplexere exteme Standardprotokolle ubersetzt werden. 
Es soil besonders darauf hingewiesen werden, dass unter Peripherie auch 
5 Speicher verstanden werden, wie bei den bereits aufgezahlten Busprotokollen 
verdeutlicht wird. 

Ebenfalls ist erf indungsgemaS besonders relevant, dass PAEs auch mehrere 
Anschltlsse an dedizierte Bus syst erne aufweisen kOnnen. 

10 

Desweiteren sind anwendungsabhangig auch Architekturen sinnvoll, bei denen 
nur eine Teilmenge der PAEs Anschltlsse an ein dediziertes Bus system aufweist, 
oder unterschiedliche PAEs mit einer unterschiedlichen Anzahl von Anschluss en 
an ggf. auch unterschiedliche dedizierte Bussysteme aufweisen. 

15 

Im folgenden wird eine detaillierte Beschreibung einer AusfUhrungsvariante 
der erfindungsgemafien Kopplung von IPAE und REAM ausgeftthrt: 

Es wird erf indungsgemaS bei ein em in Funktion und/ oder Verne tzung 

20 insbesondere zur Lauf zeit ohne StOrung nicht zu rekonf igurierender Elemente 
rekonfigurierbaren Zellelementef eld zur Datenverarbeitung mit Punktionszellen 
zur Ausfuhrung algebraischer und/ oder logischer, konfigurierbarer Funktionen 
und Speicher zell en, urn Informationen zu empfangen, abzuspeichern und /oder 
auszugeben vorgeschlagen, dafi eine Steuerverbindung (CUD) von den 

25 Punktionszellen zu den Speicher zellen gefOhrt ist. Diese Steuerverbindung 

dient dazu, die Adress- und /oder Datenein/ausgabe aus dem Speicher durch die 
zugeordnete Punktionszelle, typisch einer ALU-PAE, steuerbar zu machen. So 
kann etwa angegeben werden, ob die nachste Obertragene Information als 
Adresse Oder als Da ten behandelt werden soil und ob ein Lese- und/ oder 
.30 Schreibzugriff erforderlich ist. Diese Datenubertragung aus der 

Speicherzeile, bei der es sich etwa urn eine RAM-PAE handeln kann, auf die 
ALU-PAE erlauben dann, daE neue, yon der ALU abzuarbeitende Befehle in diese 
geladen werden konnen. Es ist auf diese Weise moglich, lediglich durch 
Vorsehen einer dedizierten und dediziert funktionszellenkontrollierten 

35 Steuerverbindung zwischen Punktionszelle und Speicherzeile bereits mit nur 
zwei Elementen, die uber geeignete Busse verbunden sind, eine 
Seguenzerstruktur in einera Zellelementef eld aufzubauen, ohne dafi ansonsten 
weitere Mafinahmen und /oder bauliche Veranderungen erforderlich sind. In der 
Speicherzeile konnen Da ten, Adressen, Programmschritte usw. in per se aus 

40 herkommlichen Prozessoren bekannter Weise abgelegt werden. Weil beide . 

Elemente auch in anderer Weise bei entsprechender Konf iguration einsetzbar 
sind, ergibt sich eine besonders effiziente Bauweise, die sowohl 
Sequenzerstrukturen als auch vektoriellen und/oder pa- rallelisierbaren 
Strukturen besonders gut anpalSbar ist. 

45 

Es ist einsichtig, daB durch die Verwendung von lediglich zwei Zellen in 
einem Zellelementef eld, namlich der Punktionszelle und der 

7 
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Informationsbereitstellungszelle eine Vielzahl von sequenzerartigen 
Strukturen in dem rekonfigurierbaren Zellelementefeld aufgebaut werden kann. 
Dies ist insofem vorteilhaft, als oftmals bed der Datenverarbei tung , etwa in 
einem multitaskingfahigen Betriebs system, eine Reihe unterschiedlicher und 
5 voneinander per se verschiedener Aufgaben abgearbeitet werden mu£. Bs konnen 
dann eine Vielzahl derar tiger Aufgaben in einem einzigen Zellelementefeld 
effektiv gleichzeitig abgearbeitet werden. Die Vorteile fur 
Echtzeitanwendungen sind of fensichtlich. Weiter ist es auch mOglich, die 
einzelnen Sequenzerstrukturen, die in einem Zell- elementefeld unter 

.10 Vorsehung der erf indungsgemaSen Steueryerbindung aufgebaut werden, _ mi t 

unterschiedlichen Taktraten zu betreiben, etwa um den Stromverbraucb dadurch 
zu senken, dafi Aufgaben mit geringerer Priori tat langsamer abgearbeitet 
werden. Es ist Uberdies moglich, bei der Ausfuhrung per se weitgehend 
parallel er Algorithmen sequenzerartige Programmteile in dem Feld parallel 

15 oder vektoriell abzuarbeiten und umgekehrt. 

Das Zellelementefeld mit den in Funktion und/ oder Vernetzung konfigurierbaren 
Zellen kann einsichtigerweise einen Prozessor, einen Coprozessor und/ oder 
einen Mikrocontroller bilden, bzw. eine parallele Vielzahl oder Kombinationen 
20 derselben . 

Die Funktionszellen sind typisch als arithmetische Logikeinheiten gebildet, 
wobei sie insbesondere grobgranulare Elemente darstellen, die aber mit einer 
f eingranularen Statemachine versehen sein konnen. In einem besonders 

25 bevorzugten Ausftthrungsbei spiel handelt es sich'bei den ALUs um sogenannte 
erweiterte ALUs (EALU) , wie diese in den f rttheren Anmeldungen des 
vorliegenden Anmelders beschrieben wurden. Eine Erweiterung kann insbesondere 
die Steuerleitungskontrolle, Befehlsdekodiereinheit etc. umfassen, soweit 
erf orderlich . Es soil darauf hingewiesen werden, dass grundsatzlich zumindest 

30 eine Teilmenge der Funktionszellen auch aus f eingranularen FPGA-Elementen 
aufgebaut sein kann. 

Die Spei cher zellen kdnnen Daten und/oder Informationen fltichtig und/oder 
nichtflttchtig speichem. Wenn in den Speicherzellen abgelegte Informationen, 

35 seien es Programmschritte, Adressen fur einen Zugriff auf Daten oder 

registerartig bzw. heap-artig abgelegte Daten als flttchtige Daten abgelegt 
sind, so kann eine vollstandige Rekonfiguration wahrend des Betriebes 
erfolgen. Alternativ ist es moglich, nicht flttchtige Speicherzellen 
vorzusehen. Die nichtf lflchtigen Speicherzellen konnen etwa als EE-Prom- 

40 Bereich und dergleichen vorgesehen werden, in die ein rudimentares Bios- 

Programm abgelegt wird, das bei Inbetriebnahme der Anordnung auszufuhren ist. 
Auf diese Weise kann ohne weitere Bauteile eine Inbetriebnahme einer 
Datenverarbei tungseinrichtung erfolgen. Ein nichtf lttch tiger Datenspeicher 
kann auch dann vorgesehen werden, wenn aus Kosten- und /der Raumgrunden 

45 beschlossen wird, dafi immer wieder dieselben Programmteile auszufuhren sind, 
wobei dann auch unter solchen festen Programmteilen, etwa nach Art der WAVE- 
Rekonf iguration, im Betrieb gewechselt werden kann. Die Moglichkeiten, 
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derartige nichtfluchtige Speicher vorzusehen und zu verwenden, sind 
G eg ens t and anderer Schutzrechte des Anmelders. Es ist moglich, sowohl 
f luchtige als auch nichtfluchtige Daten in den Speicherzellen abzuspeicherri, 
etwa um ein Bios-Prograram fest abzulegen und die Speicherzelie dennoch fur 
5 andere Zwecke nutzen zu kOnnen . 

Die Speicherzelie ist bevorzugt so ausgebildet, dafi sie eine hinreichende 
Vielzahl von zu verarbeitenden Daten und/oder abzuarbeitenden Prograramteilen 
speichern kann . Es sei dabei darauf hingewiesen, dafi diese Programmteile 

10 sowohl als Programmschritte ausgebildet sein kdnnen, die jeweils .yorgeben, 
was eine einzelne, insbesondere die zugeordnete PAE, also insbesondere die 
die Speicherzelie steuernde Funktionszelle, ira nachsten Schritt zu tun hat, 
als auch ganze Konfigurationen fur Feldbereiche oder andere Felder beinhalten 
kann. In einem solchen Fall ist es ohne wei teres moglich, dafi die aufgebaute 

15 Sequenzerstruktur einen Befehl ausgibt, auf Qrund dessen eine Rekbnf iguration 
von Zellelementefeldbereichen erfolgt. Damit arbeitet die diese Konf iguration 
auslosende Funktionszelle dann zugleich als Ladelogik (CT) . Es sei darauf 
hingewiesen, daS die Konf iguration von anderen Zellen wiederum dergestalt 
erfolgen kann, dafi dort eine sequenzerartige Datenverarbeitung erfolgt und es 

20 ist in diesen Feldem wiederum moglich, andere Zellen im Verlauf der 

Progrannnarbeitung zu konf igurieren bzw. rekonf igurieren. Damit ergibt sich 
ein iteratives Konfigurieren von Zellelementebereichen und ein Einschachteln 
von Programmen mit Sequenzer- und Parallel-Strukturen, die ahnlich ineinander 
geschachtelt sind wie eine Babuschka. Es sei darauf hingewiesen, daS hier 

25 insbesondere durch Ein-Ausgabezellen ein Zugrif f auf weitere 

Zellelementef elder auSerhalb eines einzelnen integrierten Bausteines erfolgen 
kann, was die Gesamtrechenleistung massiv erhohen kann. Es ist insbesondere 
moglich, bei Auf treten von Konfigurationen in einem Codeteil einer in ein 
Zellelementefeld hineinkonf igurierten Sequenzerstruktur gegebenenf al 1 s 

30 entweder die Konf igurationsanf orderungen auf einem zugewiesenen 

Zellelementefeld, das von der jeweiligen Sequenzerstruktur allein verwaltet 
wird, durchzufOhren und/oder es kcnnen derartige Anf orderungen an eine 
Konfigurations-Mastereinheit abgegeben werden, um sicherzustellen, dafi eine 
gleichmafiige Belegung aller Zellelementef elder erfolgt. Es ergibt sich somit 

35 quasi ein Unterprogrammaufruf durch tJbergabe von erf order lichen 

Konfigurationen an Zellen oder Ladelogiken. Dies wird fur sich als 
schutzwurdig angesehen. Es sei auch darauf hingewiesen, dafi die Zellen, 
sofern sie selbst fur die Konf iguration anderer Zellelementfeldbereiche 
Zustandigkeit besitzen, mit hard- oder softwareartig implement ier ten FILMO- 

40 Strukturen und dergleichen zur sicherstellung einer ordnungsgemafien 

Rekonf iguration versehen sein konnen. Auf die Moglichkeit, die Speicherzellen 
wahrend der Abarbeitung von Befehl en derart zu beschreiben, dafi sich der 
abzuarbeitende Code bzw. das abzuarbeitende Programm andert, sei hingewiesen. 
In einer besonders bevorzugten Variants ist diese Art der Selbstmodifikation 

45 (SM) aber durch eine entsprechende Steuerung uber die Funktionszelle 
unterdruckt . 
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Es ist moglich, daS die Speicherzelle abgespeicherte Information hier auf die 
Aristeuerung der sie steuemden Funktionszelle direkt oder iridirekt auf einen 
zur Funktionszelle fuhrenden Bus gibt. Die indirekte Ausgabe kann 
insbesondere dann erfolgen, wenn beide Zellen benacbbart liegeh und die durch 

5 Ansteuerung angef order te Information an die ALU-PAE liber ein Bus segment 
eintref fen mu£, das nicht unmittelbar mit dem Ausgang der Speicherzelle . 
verbunden werden kann. In einem solchen Pall kann die Speicherzelle Daten auf 
dieses Bus system insbesondere ttber Ruckwartsregister (Backward-Register) 
ausgeben. Es ist daher bevorzugt, wenn zumindest eine von Speicherzelle 

10 und/ Oder Funktionszelle ein solches Backward-Register aufweist, welches im 
Informationsweg zwischen Speicherzelle und Funktionszelle angeordnet werden 
kann. Dies e Register brauchen in einem solchen Fall nicht zwingend mit 
weiteren Funktionalitaten versehen sein, obwohl dies etwa bei Anforderung von 
Daten aus der Speicherzelle fur die weitere Verarbeitung, entsprechend einem 

15 herkoramlichen LOAD-Befehl eines typischen Mikroprozessors , zur Veranderung 
der Daten noch vor dem Hineinladen in die PAB ohne wei teres denkbar ist, urn 
z. B. einen Befehl LOAD++ zu realisieren. 

Mit anderen Worten werden innerhalb der beschriebenen Struktur 
Busverbindungen bei Bedarf durch die in der XPP-Technologie des Tuimelders 

20 typischen Forward (FREG) - und Backward (BREG) -Register gefuhrt. Diese besitzen 
die MOglichkeit Daten zwischen horizontalen Bussystemen vertikal zu 
Ubertragen und kCnnen mehrere Busse multiplexen oder demul tipl exen . Der 
Vollstandigkeit halber sein darauf hingewiesen, dass FREG und BREG (entgegen 
ihrer Namensgebung) nicht zwangsiaufig Regis terstuf en darstellen, sondern 

25 lediglich optional und ggf . konfigurierbare Register aufweisen. 

Die Steuerverbindung (CMD) kann dabei an FREG und/ oder BREG der jeweiligen 
Funktionszellen <PAEs) gefuhrt werden, urn die Busdaten transfers entsprechend 
des aktuell ausgeftihrten Befenls zu steuem. 

30 Die Speicherzelle wird bevorzugt dazu angeordnet sein, Inf ormationen von der 
sie steuemden Funktionszelle zu empfangen, wobei auch weiter ein 
Informationseinspeichern ttber eine Bin-Ausgabezelle und/oder eine die 
Speicherzelle nicht steuernde Zelle mOglich ist. Insbesondere dann, wenn 
Daten von einer Ein-Ausgabezelle in die Speicherzelle geschrieben werden 

35 soil en, ist es bevorzugt, wenn auch diese Ein-Ausgabezelle (I/O-PAE) von der 
Funktionszelle gesteuert wird. Dabei kann etwa die Adresse, bei welcher eine 
in die Speicherzelle zu schreibende oder gegebenenf all s auch direkt an die 
Funktionszelle (PAE) zu ttbertragende Information zu lesen ist, an die I/O-PAE 
von der ALU-PAE ubermittelt werden. Es sei in diesem Zusammenhang darauf 

40 hingewiesen, da& diese Adresse Ober eine Adre&ubersetzungstabelle 

( Adress trans la tion table) , . einen Adresstranslationbuf f er oder eine MMO-artige 
Struktur in der I/O-PAE festgelegt werden kann. Es ergeben sich insbesondere 
in einem solchen Fall die vollen Funktionalitaten typischer Mikroprozessoren. 



45 Die Funktionszellen-Speicherzellenkombination ist demnach in einer 

bevorzugten Variante zumindest ein Ein-Ausgabe-Mittel zugeordnet, mit welchem 
dann an eine externe Einheit, eine andere Funktionszelle, Funktionszellen- 

10 
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Speicherzellen-Koro-bination und/oder Speicher zell en Information gesandt 
und/oder. von dieser erapfangen werden kannv. 

Die Ein-Ausgabe-Einheit wird dabei bevorzugt gleichfalls zum Empfahg von.. 
5 Steuerbefehlen aus der Punktionszelle ausgebildet. 



Die Fuitfctionszellen-Speicherzellenkombination weist bevorzugt 
DatentransfermBglichkeiten an die tlbrigen Funktionszellen und/oder 
Speicherzellen eines VPU-Bausteines auf, insbesondere solchen, die sich im 
10 Array aus PAEs (PA) befinden. Hierzu werden Zugrif fsmfiglichkeiten Qber die 
Bussysteme auf die entsprechenden Zellen zur Verfugung gestellt. Der Zugrif f 
erfolgt bevorzugt tiber die Forward- und/oder Backward-Register der PAEs der 
Funktionszellen-Speictfierzellenkombination, durcb die tfbertragung der ■Porf- 
Steuerkommandos . 



15 



20 



In einer bevorzugten Variante ist die Steuerverbindung (CMD) dazu 
ausgebildet, zumindest einige und bevorzugt alle der nacbfolgenden 
Steuerkommandos zu Qbertragen: 



OPCODE FETCH, 

INTERNE / EXTERNE DATENZUGRI F FE , 

POSITIONIERUNG VON INTERNEN/ EXTERNEN ADRESSPOINTEEN, 
POSITIONIERUNG VON INTERNEN/ EXTERNEN PROGRAMMPOINTERN, 
25 PROGRAMMPO INTER INCREMENT, 

POSITIONIERUNG VON INTERNEN / EXTERNEN STACKPO INTERN , 
STACKZUGRIFFE (PUSH, POP) 

Beispielsweise kann diese Funktionalitat durch folgende CMD Steuerkommandos 
30 implementiert werden: 

loaoLconst: Lade eine Konstante in ein Register 

writejRap: Setze Adress Pointer fur Spei cher zugr i f f e 

(z. B. Heap) 

reaoLRap: Lese Adress Pointer fur Speicherzugrif f e 

35 (z. B. Heap) 

reaoLReg: Lese ein Register aus dem Speicher (wenn Register in der 

RAM-PAE implementiert sind) 
write_Reg: Schreibe Daten in ein Register im Speicher (wenn Register 

in der RAM-PAE implementiert sind) 
40 write&decrJRsp ; Schreibe ein Datenwort auf den Stack und dekrementiert 

den Stackpointer 

read&incr_Jtep: Lese ein Datenwort vom Stack und inkrementeiere den 

Stackpointer 
set_Rpp: Setze Programmpointer 

45 set&push^Rpp: Schreibe Programmpointer auf Stack und setze 

Programmpointer neu 
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Die Steuerkommandos dienen der steuerung der angeschlossenen Speicherzellen 
und Funktionszellen (PAEs) . Weiterhin steuern die Steuerkommandos den 
Da ten transfer auf den Bussystemen, beispielsweise durch Ansteuerung von 
Multiplexers, Switches/ Transmission Gates, o. a. in den Forward- und 
5 Backward-Regis tern (FREG/BREG) . Weitere Befehle sind z. B. : 

reaoLPort: Leee Daten von einem Port (beispielsweise implementiert 

durch ein PREG) zum Array 
write_Port: Schreibe Daten auf ein en Port (beispielsweise 

implementiert durch ein BRE6) zum Array 

10 

Dies kann durch eine entsprechende Bitbreite der Steuerleitung und eine 
zugeordnete Decodierung bei den Empfangem erfolgen. Die jeweils 
erf order lichen Steuer- und Dekodiermittel konnen problemfrei und 
kostengunstig vorgesehen werden. Wie ersichtlich, ergibt sich mit den. 
15 Signalen eine praktisch vol 1 standi ge Sequenzerf ahigkeit der Anordnung. Da& 
auf diese Weise eine Allgemeinzweckproz ess ordatenverarbeitungseinheit 
erhalten wird, sei erwahnt. 

Die Anordnung wird typisch so gewaMilt sein, dafi die Funktionszelle als 
20 alleiniger Master auf die S t euerver bindung und/oder ein als Steuerverbindung 
dienendes Bus segment bzw. Bus system zugreifen kann. Es ergibt sich somit eine 
Anordnung, bei der die Steuerleitung als Command-Lei tung wirkt, wie sie in 
herkommlichen Prozessoren vorgesehen ist. 

25 Die Funktionszelle und die Speicherzelle bzw, I/O-Zelle sind bevorzugt 

benachbart angeordnet. Unter benachbart kann dabei wie bevorzugt verstanden 
werden, daB die Z ell en unmittelbar nebene inander angeordnet sind. Altemativ 
befinden sie sich zumindest dicht beieinander. Die Anordnung der Funktions- 
und Speicherzellen in Nachbarschaf t zueinander sorgt dafttr, daB keine, 

30 jedenfalls keine signif ikanten Latenzzeiten zwischen Ansteuerung und 

Dateneingang der angef order ten Information in der Funktionszelle auf tret en, 
. nur weil die Verbindungen zwischen den Zellen zulang sind. Dies sei als 
„direkt* verstanden. Mtissen Latenzzeiten berucksichtigt werden, so kann auch 
ein Pipelining in den Sequenzerstrukturen vorgesehen werden. Dies wird 

35 besonders wichtig bei sehr hoch getakteten Anordnungen . Es sei darauf 

hingewiesen, dafc es ohne wei teres m&glich ist, entsprechend hochf requent 
getaktete Zelleinheiten vorzusehen, die wie im Stand der Technik per se 
bekannt, auch entsprechend schnell auf geeignete Speicherzellen zugreifen 
k&nnen. Auch in einem solchen Fall, etwa wenn per se bekannte 

40 Architekturelemente fur die Funktionszellen verwendet werden, wird 

gleichzeitig eine Rekonf igurierbarkeit des Funktionszellenelementes und der 
zugehdrigen Verne tzun gen vorzusehen sein. In einer besonders bevorzugten 
Variante sind die Funktionszellen, die Informationsbereitstellungszellen wie 
Speicherzellen, I/O-Zellen und dergleichen multidimensional angeordnet, 

45 insbesondere nach Art einer Matrix bzw. auf Gitterpunkten eines 

eindimensionalen Gitters usw. Wenn eine regelmafcige Struktur vorliegt, wie 
dies dort der Fall ist, wird einer Zelle typisch aus einer ersten Reihe 



WO 03/036507 



PCT/EP02/10572 



Information, das heiEt Operanden, Konfigurationen, Trigger signale usw. 
zugeftihrt, wahrend in einer darunterliegende Reihe Da ten,* Trigger signale und 
andere Inf ormationen abgegeben werden. In einem solchen Fall wird es 
bevorzugt sein, wenh die Zellen in ein und derselben Reihe liegen und es kann v 
5 dann der Inf ormations transfer aus der Inf ormationsbereit stel lungs zelle in den 
erforderlichen Eingang der Funktions zelle Uber ein Backward-Register 
erfolgen. Die Moglichkeit, die Register fur Pipelining zu benutzen, sei 
erwahnt. 

10 Es wird weiter Schutz beansprucht filr ein Verfahren zum Betrieb eines 

Zellelementefeldes, insbesondere multidimensional en Zellelementefeldes mit 
Funktionszellen zur Ausftihrung algebraischer und/oder logischer Funktionen 
und Inf ormations bereitstellungszellen, insbesondere Speicher zellen und/oder 
Ein-Ausgabezellen zum Empfangen und/oder Ausgeben von Inf ormationen und/oder 

15 Speichem derselben, wobei zumindest eine der Funktionszellen Steuerbef ehle 
an zumindest eine Inf ormationsbereitstellungszelle ausgibt, dort im 
Ansprechen auf die Steuerbef ehle Information fur die Funktions zelle 
bereitgestellt wird und die Funktionszelle dazu ausgebildet ist, die weitere 
Datenverarbeitung im Ansprechen auf die bereitgestellte Information 

20 durchzufilhren, um so sequenzerartig Daten zu verarbeiten. 

Es wird also in einem rekonfigurierbaren Feld durch die Ausgabe der 
Steuerbef ehle an die Speicher zelle einer Seguenzerstruktur eine 
sequenzerartige Datenverarbeitung ermoglicht. Die Befehle, die als 
25 Steuerbef ehle von der Funktionszelle ausgegeben werden kGnnen, ermCglichen 
dabei ein en seguenzerartigen Betrieb, wie er aus herkomml ichen Prozessoren 
bekannt ist. Es sei darauf hingewiesen, dafi es ohne weiteres mdglich ist, nur 
Telle der genannten Befehle zu implementieren und dennoch eine vollstandig 
sequenzerartige Datenverarbeitung zu gewahrleisten. 

30 

Die vorstehende Ausf Uhrungsvariante wird im f olgenden noch einmal und 
beispielsweise anhand der Zeichnungen beschrieben. In dieser ist gezeigt 
durch: 

35 Fig. 1 ein erf indungsgemcUSes Zellelementef eld. 

Fig. 2a ein Detail hiervon, 

Fig. 2b, c das Detail von Fig. 2a wahrend verschiedener 

Datenver arbei tungs zei ten , 
Fig. 3a eine alternative Ausftlhrungsforra des Details 

40 von Fig. 2, 

Fig. 3b eine besonders bevorzugte Variante des 

Details. 

Fig. 4 Grundaufbau einer Funktions-/ Speicherzelle 

(PAE) 

45 Fig. 5 eine Ausgestaltungsvariante von Fig. 3b 
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Nach Fig. l(a/b) umfaSt ein allgemein mit 0101 bezeichnetes Zellelementefeld 
zur Datenverarbeitung 0101 Funktionszelleh 0102 zur Ausftihrung von 
arithmetischen und/oder logischen Funk t ion en sowie Speicherzellen 0103, um 
v Inf orroationen zu empfahgen, abzuspeichern und/oder auszugeben, wobei eine 
5 Steuerverbindung 0104 von Funktionszellen 0102 zu den Speicherzellen 0103 
gefuhrt 1st. 

Zunachst wird die Arbeitsweise von Fig. la beschrieben. Fig. lb stellt eine 
bevorzugte Ausgestaltung und Anordung der Funktionszellen und Speicherzellen 
10 dar. 

Das 2ellelementefeld 0101 ist in der Vemetzung der Elemente 0102, 0103, 0104 
frei konfigurierbar, und zwar ohne den laufenden Betrieb nicht neu zu 
konf igurierender Zellelementeteile zu storen. Dabei kOnnen die Verbindungen 
konfiguriert werden, indem Bussysteme 0105 wie erforderlich geschaltet 

15 werden. Weiter sind die Funktionszellen 0102 in ihrer jeweiligen Funktioh 
konfigurierbar. Bei den Funktionszellen handelt es sich um arithmetische 
Logikeinheiten , die um bestimmte, Rekonfiguration ermoglichende Schaltkreise 
erweitert sind, wie Statemachines, Schnittstellenbeschaltung zur 
Komrounikation mit der bevorzugt au&erhalb des Zellelementefeldes angeordneten 

20 Ladelogik 0106 usw. Auf die entsprechenden Voranmeldungen des Anmelders wird 
hingewiesen. 

Die Zellelemente 0102, 0103 des Zellelementefeldes 1 sind zweidimensional in 
Reihen und Spalten angeordnet, wobei jeweils eine Speicherzelle 0103 

25 unraittelbar neben einer Funktionszelle 0102 liegt und hier je Reihe drei 

Speicherzellen-Funktionszellen-Paare vorliegen, in den en die Funk t ions- und 
Speicherzellen jeweils ttber Steuerverbindungen 0104 miteinander verbunden 
sind. Die Funktions- und Speicherzellen 0102, 0103 weisen Eingange auf, die 
mit dem Bus system oberhalb der Reihe, in der sich die jeweiligen Zellelemente 

30 verbindbar sind, um Daten davon zu empfangen. Weiter weisen die Zellen 0102, 
0103 Ausgange auf, die auf das Bussystem 0105 unterhalb der Reihe Daten 
ausgeben. Wie noch erlautert werden wird, ist Oberdies jede Speicherzelle 
0103 mit einem Rtickwartsregister (BW) versehen, durch welches Daten von dem 
Bus unterhalb einer Reihe auf den Bus oberhalb der jeweiligen Reihe 

35 durchgeschleust werden kflnnen. 

Mit Ausnahme der Steuerverbindungen 0104 und der zugeordneten Schaltungen 
innerhalb der Funktionszellen (ALU in Fig. 2) bzw. Speicherzellen (RAM in 
Fig. .2) handelt es sich bei dem Zellelementefeld zur Datenverarbeitung von 

40 Fig. 1 um ein herkdmmliches Zellelementefeld, wie es bei rekonf igurierbaren 
Datenverarbeitunsanordnungen, beispielsweise einer VPU entsprechend der XPP- 
Technologie des Anmelders gebrauchlich und bekannt ist. Insbesondere kann das 
Zellelementefeld von Fig. 1 wie bekannt betrieben werden, weist also 
entsprechende Beschal tungen zur Wave-Rekonfiguration, zum Debugging, 

45 Obertragen von Triggersignalen etc. auf. 
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Die Besonderheiten des Zellelementefeldes der vorliegenden Erf indung ergeben 
sich aus 'der steuerverbindung 0104 und der zugehorigen Beschaltuhg, die 
nachfolgend naher beschrieben werden wird mit Bezug auf die Fig. 2a-c- Es sei 
dabei erwahnt, daS, wahrend in Fig. 1 eine Steuerverbindung 0104 stets von : 

5 einem weiter links liegende Funktionszellenelement zu einer weiter rechts 

liegenden Speicherzelle gefOhrt ist, und zwar nur und genau zu einer solchen 
Speicherzelle, es einleuchtenderweise moglich ist, auch fttr die 
Steuerleitungen eine konf igurierbare Vernetzung vorzusehen, urn entweder an 
anderer Stelle liegende Speicherzellen anzusprechen und/oder urn ggf . mehr als 

10 eine Speicherzelle ansprechen zu konnen, wenn etwa in groSem Umfange 

Speicherbedarf fur Inf ormationen besteht, die von den Speicherzellen zu 
empfangen, abzuspeichern und/oder auszugeben ist. Aus Grunden der 
t)bersichtlichkeit wird aber in Fig. 1 und 2 lediglich auf fest vorgesehene 
einzelne Steuerverbindungen Bezug genommen, was das Vers tandnis der Erf indung 

15 wesentlich erleichtert. Die Steuerverbindung ist im Qbrigen 

erforderlichenfalls durch herkcmmliche Leitungen, entsprechende Protokolle 
yorausgesetzt, substituierbar. 

In Fig. 2 ist die Funktionszelle 0102 als ALU und die Funktionszelle 0103 als 
20 RAM bezeichnet. Oberhalb der Reihe, in der die Zellen liegen, verlauft der 

Bus 0105a, der das bereits erwahnte Backward-Register 0103a mit den Bingangen 
0103b der Speicherzelle und 0102b der ALU verbindet. Das unterhalb der Reihe 
verlaufende Bus system ist mit 0105b bezeichnet und es sind von dem Bus system 
0105a, 0105b nur die relevant en Segmente gezeichnet. Es ist erkennbar, daS 
25 das Bus system 0105b altemativ Daten erhalt aus einem Ausgang 0102c der ALU 
0102, einem Ausgang 0103c des HAM 0103 und da£ es Daten in den Bingang 0103al 
des Backward-Registers fahrt. 

Die ALU 0102 weist zugleich weitere Ein- und Ausgange 0102al, 0102a2 auf, die 
30 auf andere Bussegmente geschaltet sein konnen und tiber welche die ALU Daten 
wie Operanden empfangt bzw. Ergebnisse ausgibt. 

Die Steuerverbindung 0104 bef indet sich dauerhaf t unter der Kontrolle der 
erweiterten Schaltkreise der ALU und stellt hier eine Verbindung dar, liber 

35 welche eine Vielzahl von Bits ttbertragen werden kann. Die Breite der 
Steuerverbindung 0104 ist dabei so gewahlt, daS zumindest die zuvor 
beschreibenen Steuerbef ehle an die Speicherzelle und die Forward/ Backward- 
Register (FREG/BREG) tiber t rag en werden k6nnen. Die Speicherzelle 0103 weist 
zugleich bevorzugt drei Speicherbereiche auf, namlich einen sog. Stack- 

40 Bereich, einen Heap-Bereich und einen Programm-Bereich. Jedem Bereich ist 
dabei ein eigener Zeiger zugeordnet, tiber den bestimmt ist, auf welcben 
Bereich des Stacks, des Heaps und des Programmbereiches jeweils lesend Oder 
schreibend zugegriffen wird. 

45 Der Bus 0105a wird im Zeitmultiplex gemeinsam von den Einheiten 0102 und 0103 
verwendet. Dies ist in den Fig. 2b, 2c angedeutet. So ist in Fig. 2b eine 
Situation gezeigt, in welcher aus dem Ausgang 0102a2 der ALU-PAE Daten uber 
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das Backward-Register auf den Eingang der RAM-Zelle gesandt werden konnen, 
wohingegen der zeitgleich bestehenden, wenngleich nicht benutz ten Verbindung 
zwischen dem Ausgang 0103c des RAM zum Bus 0105b und der Verbindung zwischen 
dem Ausgang de s Backward-Registers BW zum Eingang 0102b der ALU-PAEzum : 
5 Zeitpunkt von Fig. 2b keine Bedeutung zukommt, weshalb diese gestrichelt 
angedeutet sind. In Fig. 2c ist hingegen ein Zeitpunkt gezeigt, zu welchem 
die Speicherzelle 0103 fiber ihren Ausgang 0103c aus dem fiber Steuerleitung 
0104 bestimmten Speicherbereich Stack (0203), Heap (0202), Program (0201) die 
Information Ober das Backward-Register an den Eingang 2b der ALU-PAE 0102 
10 speist, wahrend der Ausgang der ALU-PAE 0102c inaktiv ist und am Eingang 
0103b der RAM-PAE kein Signal empfangen wird. Aus dies em Grund sind die 
entsprechenden Verbindungen strichpunktiert und somit als inaktiv 
dargestellt. 

15 Innerhalb der RAM-Zelle 0103 ist eine Schaltung 0103d vorgesehen, in der die 
fiber die Steuerleitung 0104 bzw. das Steuerleitungsbus segment 0104 empfangene 
Information decodiert wird. 

Die Aus fuhrungsvari ante der Erfindung wird verwendet wie folgt: 

20 

Zunachst empfangt die ALU 0102 Konf igurationsinf ormation von einer zentralen 
Ladelogik, wie im Stand der Technik bereits bekannt. Die 

Informationsfibertragung kann in per se bekannter Weise unter Verwendung des 
RDY/ACK-Protokolls und dergleichen geschehen. Auf die M&glicnkeit, bei der 
25 Ladelogik einen FILMO-Speicher usw. vorzusehen, urn eine ordnungsgemafie 
Konfiguration der Anordnung zu ermoglichen, wird hingewiesen. 

Mit den Da ten fur die Konfiguration der ALU 0102 wird zugleich eine Reihe von 
Daten aus der Ladelogik fiber tragen, die ein sequenzerartig abzuarbeitendes 

30 Prograrnm darstellt. Dieses Programm kann entweder bereits das zur Berechnung 
bzw. Ausftthrung der Applikation auszufuhrende Programm sein, oder einen ft 
Urlader (Boot) darstellen, der erst das auszufuhrende Applikationsprogramm 
von einer extemen Einheit (Speicher, Peripherie) ladt. Das Laden des 
Programmes kann entfallen, wenn ein Teil des der ALU zugeordneten Speichers 

35 nichtflOchtig (z. B. ROM, EPROM, EEPROM, Flash-ROM) ausgestaltet ist und ein 
Urlader oder das Applikationsprogramm dort fest gespeichert ist. Dies kann 
insbesondere dann von Vorteil sein, wenn die Applikation vorab bekannt ist 
und unabanderlich gestaltet werden kann, da eine feste Implementierung dann 
zu einer erheblichen Kostenreduktion ftihren kann. Die ALU gibt deshalb 

40 wahrend ihrer Konfiguration auf der Leitung 0104 einen entsprechenden Befehl 
aus, der den Programmzeiger zum Schrelben auf einen vorgegebenen Wert 
innerhalb des RAM setzt. Danach werden von der Ladelogik bei der ALU 
empfangene Daten Ober den Ausgang 0102c fiber den Bus 0105bl und das Backward- 
Register 0103a gespeist und gelangen von dort in den Eingang 0103b der RAM- 

45 PAE 0103. Von der Einheit 0103d werden entsprechend des Steuerbef ehls auf 
Steuerleitung 0104 dann Daten auf den angewiesenen Programmspeicherplatz 
geschrieben. Dies wiederholt sich, bis samtliche, von der Ladelogik bei der 
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Konfiguration empf angenen Programmteile in der Speicherzelle 0103 abgelegt 
sind. Wenh dann die konfiguration der ALU beendet ist, wird diese durch . 
Ausgabe der entsprechenden Befehle auf der Steuerleitung 0104 die nachsten, 
von ihr sequenzerartig abzuarbeitenden Programmschritte anfordern und tlber 
5 den Ausgang 0103c, den Bus 0105b, das Backward-Register der RAM-PAE 0103 und 
den Bus 0105a an ihr em Eingang empfangen. Wahrend der Programmabarbeitung 
konnen dabei Situationen auftreten, bei denen Sprttnge innerhalb des 
Pr ogr ammspei cherber ei ches erforderlich sind, Daten in die ALU-PAE aus der 
RAM-PAE geladen werden, Daten im Stack abgelegt werden mussen usw. Die 

10 diesbezugliche Kommunikation zwischen ALU-PAE und RAM-PAE erf olgt Ober. die 
Steuerleitung 0104, so dafi die ALU-PAE zu jedem Zeitpunkt die Dekodierung 
durchfGhren kann. Oberdies kfinnen auch, wie bei einem her kfimml i chen 
Mikroprozessor, Daten aus einem Stack oder einem anderen RAM-Speicherbereich 
empfangen werden und es kttnnen tiberdies Daten von aufierhalb als Operanden in 

15 der ALU-PAE empfangen werden. 

Es findet dabei die Abarbeitung der Programmsequenz statt, die in den RAM-PAE 
durch die Ladelogik vorkonf iguriert wurde. In der ALU-PAE wird dabei 
zugleich, wie per se erforderlich, eine Befehlsdekodierung vorgenommen. Dies 
20 geschieht mit den per se gleichen Schaltkreisen, die schon fUr die 

Dekodierung der von der Ladelogik erhaltenen Befehle verwendet werden. 

Es wird tlber die ALU zu jedem Zeitpunkt die Steuerleitung 0104 kontrolliert, 
so dafi die RAM-Zelle stets genau die Art des Speicherzugrif fes befolgt, die 
25 von der ALU vorgegeben ist. Auf diese Weise ist sichergestellt, dafi 

ungeachtet der Zeitmultiplex-Benutzung der Buselemente 0105a, b jederzeit den 
in der Sequenzerstruktur vorhandenen Elementen vorgegeben ist, ob auf den 
Bussen Adressen fur zu holende und/oder zu schreibende Daten oder Codes 
liegen oder ob und gegebenenf alls wohin Daten zu schreiben sind etc . 

30 

Die in Bezug auf Fig. 2 gezeigte Anordaung kann auf unterschiedliche Arten 
erweitert oder verandert werden. Besonders relevant sind die in Fig. 3a und 
3b dargestellten Varianten. 

35 Nach Fig. 3a ist zur Verbindung von ober en und unteren Bussen nicht nur ein 
Backward-Register an der RAM-PAE vorgesehen, sondern es sind auch ein 
Vorwarts -Register an der RAM-PAE und Vorwarts- und RUckwarts -Register an der 
ALU-PAE vorhanden. Diese kOnnen, wie durch die Mehrfach-Pf eile angedeutet, 
dazu di en en, von anderen Einheiten, wie externen Hosts, extemen Peripherie- 

40 Geraten wie Festplatten, Hauptspeicher und dergleichen und/oder von anderen 
Sequenzerstruktur en, PAEs, RAM-PAEs etc. Daten zu empfangen und an diese zu 
senden. Wenn ein entsprechender Anforderungsbefehl fur neue Programmteile aus 
der Sequenzerstruktur, die durch die ALU-PAE und die RAM-PAE gebildet ist, 
abgesandt wird, ist es mOglich, ProgrammblOcke in der Sequenzerstruktur 

45 abzuarbeiten, die weit gr6fier sind als jene, die in der RAM-PAE speicherbar 
sind. Dies ist insbesondere bei konplexen Datenverarbeitungsaufgaben, 
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Sprting en (iber weite Bereiche, insbesondere in Unterprogramme usw. von 
massivem Vorteil. 

Eine noch weiter bevbrzugte Variante 1st in Fig. 3b gezeigt. Hier , 
5 kommuniziert die ALU- PAE nicht nur init einer RAM- PAE, sondem zugleich mit 
einer Input /Output-PAE, die dazu ausgebildet ist, eine 

Schnittstellenbeschaltung far die Koimtuinikation mit extern en Bauelementen 
vorzusehen, wie Festplatten, anderen XPP-VPUs, fremden Prozessoren und 
Coprozessoren usw. Wiederum ist die ALU-PAE die Einheit, die als Master fur 
10 die als ,CMD* bezeichnete Steuerverbindung arbeitet und wiederum werden die 
Busse in Multiplex -Weise verwendet. Auch hier kann eine Obertragung von Da ten 
von dem Bus unterhalb der Reihe in den Bus oberhalb der Reihe durch das 
Backward-Register erfolgen. 

IS Die in Fig. 3b gezeigte Anordnung ermoglicht es, exteme Zugriffe auf nicht 
in der Speicherzelle RAM- PAE abspeicherbare Inf orraationen besonders leicht zu 
gestalten und ermoglicht damit eine Anpassung der Sequenzerstruktur an 
bestehende, herkOmmliche CPU-Technologien und deren Betriebsverfahren in noch 
staVrkerem Mafie insoweit, als nun in der Eingabe-Ausgabezelle 

20 Adressubersetzungsmittel, Speicherverwaltungseinheiten (MMU-Funktionen) und 
dergleichen implementiert sein kfinnen. Die RAM-PAE kann hier etwa als Cache, 
insbesondere aber als vorgeladener Cache dienen. 

Es sei darauf hingewiesen, daS mehrere Sequenzerstruktur en gleichzeitig in 
25 ein und dasselbe Feld hineinkonfiguriert werden kttnnen, dafi Funktionszellen, 
Speicherzellen und ggf . Ein-Ausgabezellen wahlweise fur Sequenzerstruktur en 
und/ oder eine fur die XPP-Tecbnologie herkoramliche Weise konfiguriert werden 
kCnnen und daS es ohne wei teres moglich ist, dafi eine ALU an eine andere ALU 
Daten ausgibt, die diese in einer Sequenzer -Weise konf igurieren und/oder zum 
30 Tell eines Zellelroentefeldes machen, mit dem eine bestimmte Konfiguration 
abgearbeitet wird. Auf diese Weise wird dann gegebenenfalls auch die 
Ladelogik entbehrlich. 

Figur 4 zeigt nun noch einmal detailliert den Grundaufbau einer PAE. Der Kern 
35 einer PAE, typischerweise bestehend aus einer oder mehreren ALUs und/oder 
einem Speicher und/oder FPGA-Elementen erh&lt Daten von dem Bussystem 0105a 
und ubertrSgt die Ergebnisse der Datenverarbeitung an das Bussystem 0105b. 
Neben dem Kern sind die Forward-Register (FREG, 0402) und Backward-Register 
(BREO, 0403) angeordnet und tibertragen Daten von 0105a nach 0105b (FREG) bzw. 
40 von 0105b nach 0105a (BREO) .BREO und FREG kSnnen eberifalls eine oder mehrere 
ALUs und/oder einem Speicher und/oder FPGA-Elementen en thai ten. Bevorzugt 
sind diese jedoch in ihrem Funktionsumfang gegenuber dem Kern (0401) 
eingeschrankt . 

Die Bussysteme 0105a und 0105b sind bevorzugt jeweils in ein Bussystem zur 
45 Cbertragung von Daten (DATA) und ein Bussystem zur Obertragung von Trigger, 
also Statussignalen (TRIGGER) unterteilt. 
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Die Konf iguration der PAE erfolgt durch eine ubergeordnete 
Konfigurationseinheit (z J B. eine CT) ■, die uber einen Konf igurationsbus 
(0404) Konfigurationsworte an die PAE ubertragt. Diese werden in 
• Konf igurationsregis tern gespeichert (0405). Optional kann ein 
5 Konfigurations stack (0406) nach PACT17 und wie nachfolgend beschrieben 

zwischen den Konfigurationsbus (0404) und die Konf igurationsregis ter (0405) 
zwischengeschaltet eein. 

Der Konf igurationss tack kann Da ten und/ oder bevorzugt Trigger von den 
Bussystemen 0105 (a/b) empfangen und an diese senden. 

.10 

Die PAE kann optional einen AnschluS an ein dediziertes Bus system (10- 
Channel, 0407) aufweisen. Zur Steuerung des Bus systems ist dem Kern (0401) 
eine zusatzliche Bussteuereinheit (0408) zugeschaltet. uber den IO-Channel 
kan die PAE direkt mit einem global en, ggf . auch externen Speicher und/ oder 
15 Peripherie und/oder anderen PAEs Da ten Ubertragen. 

In einer bevorzugten Ausgestaltung best eh t die Moglichkeit Konstanten fur die 
Datenverarbeitung uber 0404 zu setzen. In einer weiteren Ausgestaltung kann 
eine Konfigurationseinheit (z. B. CT) Daten aus den Arbeitsregi stern 
20 auslesen . 

Figur 4 kann auch eine entsprechende RAM- PAE darstellen. fiber 0404 kann dann 
von einer CT die Vernetzung und Funktion des RAMs eingestellt werden. 
Die Funktion umfafit beispielswiese folgende Funktionen oder Kombinationen 
25 da rauts; 



1. Random Access 

2. FIFO 

3. Stack 
30 4. Cache 

5. Page Memory fur MMOs 

De sweater en kann in einer bevorzugten Ausfuhrung der Speicher mit Daten von 
der CT vorgeladen werden (z. B. Konstanten, 
35 Lbokup-Tabellen, etc.). Ebenfalls kann die CT in einer erweiterten Ausfuhrung 
Daten (z. B. zum Debuggen oder fur Taskwechsel) aus dem Speicher uber 0404 
zurucklesen. 

In einer bevorzugten Ausfuhrung kann eine RAM- PAE mehrere Anschluss e an das 
Bus system 0105 aufweisen (dual -port oder multi-port) , wodurch mehrere 
40 Da ten transfers gleichzeitig durchgefuhrt werden kcnnen. 

In einer weiteren Ausfuhrung kann die RAM- PAE einen dedizierten Anschlufi an 
einen externen Bus aufweisen. 

RAM- PAEs konnen der art zusammengeschaltet werden, dass aus mehreren (n) RAM- 
PAEs ein n-fach groSerer Speicher entsteht. 
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Figur 5 zeigt eine Ausgestaltungsvariante des Sequenzers nach Pigur 3b. Die 
ALU-PAE weist einen minimal en Regis tersatz Ra, Rb, Rx auf, der in diesem 
Beispiel lediglich zur Puf ferung der Operanden und Ergebnisse dient. Der 
eigentliche Registersatz liegt in der RAM-PAE (R0. .Rn) • Ebenfalls innerhalb 
5 der RAM-PAE liegen die Register 
Rpp: Programm Pointer 

Rap: Adress Pointer fur Datenzugrif f e (z.B. Heap) 

Rsp: Stack Pointer fur Stackzugrif f e 

Rfp; Frame Pointer zur Sicherung des Stack Pointers 

10 bei Unterprogrammauf ruf en ... 

Der CMD-Bus wird von der ALU-PAE gesteuert und fiber tragt die 
Ablauf information des Seguenzers an samtliche beteiligten PAEs, sowie FREG 
und BREG zur Steuerung der DatenObertragung auf den Bussystemen (0105a, 
15 0105b). 

Die RAM-PAE weist in diesem Ausgestaltungsbeispiel einen dedizierten IO- 
Cannel (0501) auf, uber welchen sie ggf . auch selbststandig (z. B. tiber DMA- 
Kontroller) Daten von Oder zu peripheren Einheiten (z.B. IO, Speicher) 
ubertragen kann. Es soil nochmals darauf hingewiesen werden, dass auch die 
20 ALU-PAEs einen solchen dedizierten AnschluS aufweisen konnen oder in einer 
we iter en Ausgestaltungsvariante die ALU-PAE anstatt der RAM-PAE einen 
derartigen AnschluS besitzen konnte. 

Optional sind eine oder mehrere Datenaustauschvorrichtungen mit den 
restlichen Zellen des PAs (z. B. Funktions- und /oder Speicherzellen) 

25 implement iert. Ober Eingabe-Ports (0502) konnen Daten von dem PA gelesen 
werden und uber Ausgabe-Ports (0503) konnen die Daten ausgetauscht werden. 
Die Port werden beispiel sweise uber die CMD-Steuerkommandos readLport und 
write_port angesteuert und schalten die Bussysteme entsprechend. Mit den 
Steuerkommandos wird ein Selektor ubertragen, der anzeigt welcher Port durch 

30 das Steuerkommando angesprochen ist. 

Die vorl legend offenbarte Lage der Register innerhalb der RAM-PAE ist 
ungewShhlich, bietet aber zwei erhebliche Vorteile: 

a) Speicherzellen kOnnen fur die Register verwendet werden. 

b) Die Pointer liegen direkt in der RAM-PAE, wodurch Datenzugrif fe auf den 
35 Speicher besonders schnell werden. Desweiteren ist ftlr samtliche Spaicher- 

Zugriffe nur ein Bus auf dem Bussystem 0105 notwendig, wobei der 
normalerweise zusatzlich erforderliche Adressbus entfallt, da die Adressen 
lokal in der RAM-PAE durch die Pointer gegeben sind. 

Diese Anordnung wird daher als vom Anmelder bevorzugt typisch implement iert . 

40 

Fur samtliche Datentransf ers ist die Lage der Register zu beachten. Um 
lediglich moglichst einfache Befehle im Sequenzer zu implementieren, sind 
daher besondere Befehle zur Regis termanipulation vorgesehen: 
moveta Rrr: Ladt das Register Rrr (rr e {l..n, sp, pp, 
45 fp, ap)) nach Ra 

movetb Rrr: Ladt das Register Rrr nach Rb 
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movefx Rrr: Schreibt das Register Rx nach Rrr 



5 



Um den DatenfluScharacter der ALU zu wahren, ist bevorzugt ein weiterer 
besonderer Opcode irapl emeriti er t : 

feed: ttbertragt Daten von Ra/Rb nach Rx, ohne diese 



zu manipulieren. 



Nachfolgende Beispiele verdeutlichen die Arbeitsweise des Sequenzers: 
Addiere Register Rl zu Register R2 und schreibe Ergebnis nach Register R2 : 



Schiebe Register R4 nach Register R7: 
moveta R4; feed; movefx R7; 

15 Cbertrage R5 auf Stack: 

moveta R5; feed? push; 
Anmerkung: push tibertragt Daten des Registers Rx an die Speicherstelle auf 
die Rsp zeigt und dekrementiert (bzw. inkermentiert) Rsp. 

20 Setze Adresspo inter Rap mit der indirekten Adresse R4 addiert zu R7: 



Lade Daten aus Speicherstelle Rap nach Rl: 
load; feed; movefx Rl; 
25 Anmerkung: load ubertragt Daten von der Speicherstelle auf die Rap zeigt nach 
Ra. 

Die Datenregister werden bevorzugt innerhalb des Speichers der RAM-PAE 
angeordnet, z. B. von Adresse 0x0 bis 0x7 (fttr n = 7) . Register werden 
30 beispielsweiee angesprochen, indem beira Auf treten des entsprechenden CMD 

Steuerkommandos- (z. B; reac^reg, write_jreg) die Regis ternummer mi tuber tragen 
wird, diese als Adresse an den Speicher Ober tragen wird und die hOherwertigen 
Adressbits mit 0 gefttllt werden. 

Die Startadresse fttr den Code ware dann beispielsweise 0x8 (also 0x(n+l)), 
35 worauf dann der Programmpointer Rpp nach ein em Reset zeigen wttrde. 

Die Adresszeiger werden bevorzugt nicht im Speicher abgelegt, sondern in 
gesondert irapl eraentier ten Regi stern untergebracht, um eine schnelle und 
einfache Aufschaltung auf die Adressleitungen des Speichers zu ermoglichen. 

40 In Pigur 5b 1st eine Architekturvariante mit Regis tersatz innerhalb der ALU- 
PAB dargestellt. Die umstandlichen Registertransferoperationen entf alien 
damit, wodurch diese Variants auch erheblich schneller in der 
Datenverarbeitung ist. Aller dings ist sind die Hardwarekosten hfiher, da der 
Registersatz zusatzlich implementiert werden muss und fur samtliche 

45 Speicherzugrif fe die Adressen von der ALU-PAE an die RAM-PAB ttbertragen 
werden mttssen. 



10 



moveta Rl; movetb R2; add; movefx R2; 



moveta R4; movetb R7; add; movefx Ra; 



21 



WO 03/036507 



PCT/EP02/10572 



RAMoverPAE 

Die nachfolgerid beschriebene besoridere Ausgestaitung eirier ALU-PAE (im 
Folgenden mit ROP-PAE bezeichnet) eignet sich besonders fur VPUs, deren 
Applikation irregulare sequentielle Codes aufweisen, die auf kleine.. 
5 Datenmengen in einer weitgehend ungeordneten Reihenfolge zugreifen. 

Zur Realisierung dieser Aufgabe wird in eine ALU-PAE Speicher integriert 
(Integrated RAM = IRAM) , auf den die ALU direkten Schreib/Lese-Zugriff 
besitzt. Die ALU ist entsprechend urn eine Adressverwaltungsschaltung 
10 erweitert. Insbesondere kdnnen daher PAEs nach dem vorstehend beschriebenen 
Aufbau {IPAEs) verwendet werden, wobei der separate RRAM ggf . entfallt und 
durch den integrierten IRAM ersetzt ist Oder der RRAM zusatzlich zum internen 
IRAM quasi als Speichererweiterung vorgesehen ist. 

15 In einer besonders bevorzugten Ausfuhrung ist ein Sequenzer bzw. 

Microcontroller mit einem bevorzugt limitierten aber bevorzugt vollstandigen 
Befehlssatz {vgl. ARC Microprocessor) in der ROP-PAE integriert, der die 
Verarbeitung sequentieller Codes ermoglicht. In einer weiteren 
Ausfdhrungsvariante kann der Sequenzer in seiner Funktion und s einem 

20 Ablauf verbal ten auch konf igurierbar ausgestaltet sein (wie beispielsweise 

nach dem Stand der Technik bekannt, z.B. durch EPS448 von Altera [ALTERA Data 
Book 1993]). Der Sequenzer /Microcontroller kann auf Zustande (z.B. 
Statussignale, Ereignisse) in der ROP-PAE und/ Oder auf Zustande (z. B. auch 
Trigger) anderer PAEs die mit der ROP-PAE verbunden sind (z.B. ttber ein 

25 Bussystem) reagieren. 

Der Sequenzer/Microcontroller liest seine Programmbefehle aus dem IRAM. 
Die Zugrif fe auf das Bussystem des Arrays (PA) entsprechen den ublichen PAEs, 
ebenso die Generierung, der Empfang und die Weiterleitung von Status signal en 
(Trigger nach PACT08) . Mehrere Busanbindungen fttr Da ten- und Triggereingange 

30 und ftir Daten- und Triggerausgange k6nnen vorgesehen sein. 

Die ROP-PAE kann Operanden vom Bus lesen ggf. mehrzyklisch Verarbeiten und 
das Ergebnis wieder auf deh Bus schreiben; 

In die ROP-PAE ist in einer bevorzugten Ausgestaitung ein Registersatz 
integriert. Der Registersatz kann in einer besonderen Ausgestaitung ahnlich 

35 des Registersatzes von Transputern als Stack organisiert. Dadurch kann der 
Registersatz besonders klein und hardware technisch eff izient realisiert 
werden (typischerweise reichen 3 Register A, B und C aus) . Weiterhin ist aus 
der Transputer technologie bekannt, dass Compiler eff izient mit einem 
derartigen hardwaretechnisch kostengunstigen Registersatz arbeiten kfinnen. 

40 Ebenfalls kann der Registersatz optional im RRAM liegen. 

In einer bevorzugten Ausfuhrung besitzt die ROP-PAE direkten Anschlufi 
(EXTBUS) an ein externes RAM und/ Oder externe 10. Es konnen 

applikationsabhangig mehrere EXTBUS vorgesehen sein. In einer dabei besonders 
45 bevorzugten Ausgestaitung kann der EXTBUS (Iber eine, ggf. dedizierte, 
Verbindung des PAE-Bussys terns an eine In t erf ace-Baugruppe (IOAG) wie 
beispielsweise aus DE 196 54 595.1-53 Oder DE 102 06 653.1 bekannt 
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realisiert sein. Die Ansteuerung von Speicher (RAM) und/oder Peripherie (10) 
erfolgt dabei durch die Inter facerBaugruppe . 

in einer bevorzugten AusfUhrung kann die ROP-PAJB und dabei bevorzugt das I RAM 
5 direkt selbstandig Adressen fur das externe RAM und/oder die externe 10 
und/oder andere interne Speicher (RRAM/IRAM) generieren und externe oder 
interne Daten transfers selbstandig steuern. Diese Funktion kann durch 
eigenstandige im REAM implementierte Adressgeneratoren realisiert werden. 
Beispielsweise eignen sich DMA-Kontroller besonders far diese Aufgabe, indem 
10 sie blockweise Daten zwischen den Speichern kopieren . Der Adressraum der zu 
lesenden Daten und der Zieladressraum wird entsprechend gesetzt und der 
Kopiervorgang wird gestartet. Das Setzen kann durch die IPAE erfolgen. 
In einer hardwaremaEig aufwendigeren Losung kann die Funktion durch eine 
implementierte MemoryManagementunit (MMD) realisiert sein. Die Funktionsweise 
15 ist durch den Stand der Technik def iniert und bekannt. Zusammengefafit 
arbeitet eine MMD wie folgt: 

Der von der MMO verwaltete RRAM Speicher ist in mehrere Seiten (Pages) 
aufgeteilt. Jede Page enthalt Daten eines virtuellen Speichexraumes innerhalb 
eines extemen Speichers. Beispielsweise ktfnnen die hexadezimalen RRAM- 

20 Adressen OxOaOO. .OxOaf f Daten des extemen Speichers an den Adressen 

0xbdl3200. .0xbdl32ff en thai ten. Zur Verwaltung. der Adressumsetzung wird eine 
AdressQbersetzungseinheit verwendet, die gewOhnlicherweise durch Lookup- 
Tabellen realisiert ist. Aufgabe einer MMO ist es insbesondere einen grofien 
Speicherraum auf einen sehr viel Kleineren (in diesem Fall der RRAM) zu 

25 ubersetzen. Dies geschieht der art , dass Seiten je nach Bedarf von dem groSen 
Speicherraum in den Kl einen kopiert werden. Sobald eine Seite nicht mehr 
benO tig t wird kann diese gelBscht und/oder uberschrieben werden. Wenn die 
Daten auf der Seite verandert wurden, wird die Seite bevorzugt vor dem 
Ltf schen / Oberschreiben in den grofien Speicherraum zurQckgeschrieben . 

30 Die Adressumsetzungseinheit arbeitet derart, dass ein hoherwertiger Teil der 
physikalischen Actress e (also die Adresse der Seite) in dem Lookup-Speicher 
abgelegt wird und auf die en tsprechenden Daten der Seite iin RRAM zeigt, 
sobald die Seite innerhalb des kleinen Speichers (RRAM) verfugbar ist. 
Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM ist 

35 auch keine Referenz eingetragen. In diesem Fall muss die Seite erst* von dem 
grofien (extemen) Speicherraum in den RRAM kopiert werden. Hierzu kann eine 
andere bevorzugt aktuell nicht verwendete Seite gemafi dem vorstehenden Ablauf 
Uberschrieben werden. 

Das Kopieren kann dabei automatisiert, also ohne wesentliche Beteiligung 
40 durch den Sequenzer erfolgen, indem von der MMO ein EMA-Kontroller 

angesteuert wird. Diesem werden die entsprechenden Sei tenadressen im RRAM und 
extemen RAM, sowie die Seitengrtffce durch die MMO zur Verftigung gestellt (z. 
iB. in Register eingetragen) . 

45 Die ROP-PAE besitzt einen AnschluS an eine Konfigurationseinheit die die ROP- 
PAE entsprechend des tlblichen verfahrens konfiguriert und rekonfiguriert. In 
einer bevorzugten AusfUhrung kann die CT auf den IRAM lesend und/oder 
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schreibend zugreifen, urn Da ten und/oder Code fur den Sequenzer im I RAM zu 
verwalten. 

In einer besonders bevorzugten Ausgestaltung kann die ROP-PAE selbstandig 
5 Code fQr den Sequenzer uber das PA Bus system und/oder den EXTBUS aus dem 
extemen RAM laden. 

In einer bevorzugten Ausfuhrung ist der I RAM in mehrere Segment e unterteilt, 
die in unterschiedlichen Adressbereichen liegen. Die Segmente k6nnen 
10 beispielsweise fur einige der folgenden Funktionen auf geteilt sein: 

Sequenzer speicher, Stack (z.B. f Or Registersatz ) , Datenspeicher, Heap, 10- 
Puffer, Puffer zu extern em RAM bzw. Cache, Lookuptabellen, Konfigurationen 
fur PAEs und/oder Busse, der Registersatz der ROP-PAE. 

Je nach Funktion konnen dazu folgende Ansteuermechanismen vorgesehen sein: 
15 Sequenzer- /Code-Speicher: Progranxmzeiger auf die entsprechenden 
Speicherstellen (Rpp) . 

Stack: Stackzeiger auf die oberste Speichers telle des Stack (Rsp) , 
gegebenenfalls auch ein FramePointer (Rfp) , wie er nach dem Stand der Technik 
(z.B. Intel Pentium) bekannt ist. 
20 Konfigurationen fur PAEs und/oder Busse: Hierrauf kann ein Zeiger innernalb 
der CT und/oder - implement ierungsabhangig ein Zeiger innernalb der 
Konfigurationssteuerung der PAE zeigen. 

Registersatz der IPAE: Sollte der Registersatz der PAE im Speicher 
untergebracht sein, wir dieser direkt durcb die PAE mit bevorzugt 

25 hardware technisch fest vorgegebenen adressiert. 

Die restlichen Speicherbereiche, wie Datenspeicher, Puffer, Tabellen werden 
typischerweise durch den Compiler oder Programmierer auf gebaut . Die 
Adressierung dieser Bereich erfolgt durch das auszufuhrende Programm und/oder 
Be triebs systems und wird innernalb der Programmes und/oder Be triebs systems, 

30 ggf. unter Zuhilfenahme der Regis t ersatzes und der ALU des Sequenzers, 
berechnet. 

In einer mOglichen Variante ist der IRAM komplett Oder teilweise, wie bei den 
IPAEs beschrieben, durch RAM- PAEs aufierhalb der ROP-PAE realisiert. Ftir ggf. 
unterschiedliche Segmente kOnnen unterschiedliche RAM- PAEs verwendet werden. 

35 

In einer bevorzugten Ausgestaltung kttnnen einige oder alle Segmente als 
aktive Speicher ausgestaltet sein, also eine DMA und/oder MMU besitzen und 
somit selbstandig Da ten in oder aus den ihrem Speicher von oder nach anderen 
Speichern oder Peripheriegeraten kopieren. Insbesondere kttnnen sie die 
40 Funktionen der Speicher aus der DE 199 26 538.0 aufweisen, z. B. FIFO, 
Stack, Random Access, Cache, etc., wobei ftir jedes Segment einzeln die 
Funktion konf igurierbar und/oder durch den Sequenzer pr ogrammi erbar ist.. 

In einer Ausfuhrung kann der IRAM als Multi-Port Speicher ausgefdhrt sein. 
45 Dieser kann den ggf. auch gleichzeitigen Schreib- und/oder Lese-Zugriff durch 
mehrere Speicherzugrif f seinheiten auf den Speicherinhalt ermSglichen. 
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Speicherzugrif fseinheiten kBnnen beispielsweise externe und/oder interne 
Peripherie/ Prozessoren/ andere PAEs sein. 

In einer besonderen Aus ftttirung kann die ROP-PAE als lokale und ggf . auch 
5 global e Konf igurationseinheit ahnlich einer CT fOr ROP-PAEs in der Umgebung 
arbeiten oder unter anderem diese Funktion mit erf alien. Bevorzugt arbeitet 
die ROP-PAE nach dem aus der DE 196 54 846.2-53 bekannten Verfahren bei der 
Verwendung als lokal Konf igurationseinheit . Wird die ROP-PAE als global e 
Konf igurationseinheit verwendet, oder hat sie sehr viele lokale PAEs zu 

10 konfigurieren, wird bevorzugt das Verfahren nach der DE 196 54 593.5-53 . 
verwendet, das eine PILMO-Punktionalitat aufweist und daher sehr viele auch 
unabhangige Konf igurationen verwalten kann. Die ROP-PAE adressiert gesteuert 
durch den Sequenzer /Microcontroller Konf igurationen im iram und konfiguriert 
diese an PAEs und/oder sich selbst und/oder bestimmt den Ablauf des 

15 Sequenzers /Microcontrollers. Bevorzugt findet hierbei eine Synchronisation 
mit einer Obergeordneten Konf igurationseinheit <z. B. CT oder andere PAEs) 
ahnlich der bekannten Inter-CT-Protokolle (DE 198 07 872.2, DE 100 28 397.7 , 
DE 199 26 538.0 ) statt. Die ROP-PAE kann Konf igurationen uber eines der 
EXTRAM- Interfaces selbst laden und/oder Konfigurationen von einer 

20 (ibergeordneten Konf igurationseinheit Ober das CT Interface anf ordern . Die 
Funktionsweise kann ahnlich der Rekonf igurationseinheit in der DE 196 54 
846.2-53 sein. 

ZusammengefaSt ist der prinzipielle Arbeitsweise einer ROP-PAE ahnlich eines 
25 Microcontrollersystemes, dessen Busanbindung und/oder dessen Da ten transfers 
und/oder dessen Programmablauf einem VPU- System entspricht. Mit anderen 
Worten handelt es sich um eine Multiprozessoranordnung, deren Bus system auf 
dem Prinzip der VPU- Archi tektur beruht. Die einzelnen Prozessoren werden von 
bevorzugt von einer ubergeordneten Steuereinheit (CT) verwaltet. Die 
30 DatenUbertragung ist selbstsynchronisierend tiber die REY/ACK Protokolle der 
Bussysteme. Als ein besonders wesentlicher Aspekt wird der gemeinsame 
Pro z ess or status angesehen, der uber das Triggerbus system reprasentiert wird 
und den Status einer Menge von Prozessoren reprasentiert, der unter den 
Prozessoren zur Ablauf steuerung ausgetauscht werden muS. Hierzu wird 
35 verwiesen auf DE 197 04 728.9, DE 101 39 170.6 und DE 101 29 237.6-53. 

Ebenfalls wird Schutz beansprucht fur ROP-PAEs , die zusatzlich zu ihrem 
Anschluss an die intemen Bussysteme des Arrays aus PAEs einen dedizierten 
Anschluss (10- Channel ) an ein Oberregionales Bus system aufweisen # das 

40 insbesondere Daten Ober lange Strecken inner halb des Arrays ubertragt 

und/oder insbesondere einen direkten AnschluS an die Peripherie aufweist. Der 
Anschlufi an die Peripherie kann dabei direkt erfolgen, indem z. B. das 
Bus system bereits dem peripheren Pro toko 11 entspricht oder uber entsprechende 
Pro toko llwandler zur Umsetzung des Protokolls erfolgen. Das dedizierte 

45 Bub system kann dabei bereits einem Indus triestandard entsprechen, z. B. PCI, 
RapidIO, Firewire, USB, Ethernet, RAMBUS, DDR- RAM, etc. um somit einen 
einfachen und unaufwendigen Anschluss der peripheren Oerate zu ermdglichen. 
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Gegebenenfalls kSnnen auch in zwischengeschalteten IOAGs (vgl. DE 196 54 
595.1-53 ) Protokollkonvertierimgen derart durchgeftthrt werden, dass eih 
internes vereinfachtes und ggf. proprie tares Busprotokoll auf ein oder 
mehrere komplexere exterae Standardprotokoile ttbersetzt werden. 
5 Es soli besonders darauf hingewiesen werden, dass unter Peripherie auch 

Speicher verstanden werden, wie bei den bereits aufgezahlten Busprotokoll en 
verdeutlicht wird. 

Ebenfalls 1st erf indungsgemafi besonders relevant, dass PAEs auch mehrere 
Ans chilis se an dedizierte Bussysteme aufweisen k6nnen. 
10 Desweiteren sind anwendungsabhangig auch Architekturen sinnvoll, bei denen 

nur eine Teilmenge der PAEs Anschltlsse an ein dediziertes Bussystem aufweist, 
Oder unter schiedliche PAEs rait einer unterschiedlichen Anzahl von Anschlttssen 
an ggf. auch unterschiedliche dedizierte Bussysteme aufweisen. 

15 Die beschriebene Struktur kann durch erweiterte und verbesserte 

Halbleiterherstellungsverfahren und -strukturen besonders leistungsfahig 
implementiert werden, indem der Speicher auf dem physikalischen Chip raumlich 
ttber oder unter den logischen Funktionen (ALU, Steuerung, Busse, etc.) der 
PAE angeordnet wird. Hierfur wird Schutz beansprucht. 

20 Dazu wird tiber der nach dem Stand der Technik bekannten erst en 
Halbleiter struktur (z. B. Silizium) und der damit aufgebauten 
Transistorstrukturen eine oder mehrere weitere Ebenen von 

Halbleiter struktur en (Transistorstrukturen) aufgebracht, die fur zusStzliche 
Funktionen genutzt werden kfinnen. Beispielsweise kdnnen in einer erst en Ebene 
25 . die Logik und Gatter der PAE-Funktion und in einer weiteren zusatzlichen 
Ebene die Speicher funktionen implementiert werden. 

In einer bevorzugten Bauweise werden die einzelnen Halbleiter schichten durch 
eine Isolierschicht voneinander getrennt. Die Isolierschicht kann 
Durchkontaktierungen (Vias) auifweisen, um Signal e zwischen den einzelnen 
30 Halbleiter schichten zu Obertragen . 

Die Verdr ahtungs s truk tur kann je nach Anwendung unterschiedlich implementiert 
sein. Beispielsweise kOnnen direkt uber jeder Halbleiterschicht 
Verdrahtungsebenen und/ oder eine globale Verdr ahtungs ebene , die alien 
Halbleiterschichten zugeordnet ist vorgesehen sein. 

35 

Um eine wirtschaf tliche Ausbeute zu erlangen, muss sichergestellt sein, dass 
die Gesamtschaltung, also alle Halbleiterstrukturebenen zusammen, eine 
hinreichend hohe Ausbeute erreichen. Desweiteren ist zu beachten, dass der 
Stromverbrauch, also die Verlustlei stung, aller Halbleiterstrukturebenen 
40 zusammen innerhalb eines akzeptablen Bereiches bleibt, der zu keiner 
tJberhitzung und dem damit verbundenen Ausf all der Schaltung ftlhrt. 
Es kann durch eine geeignete Zusammenstellung der Funktionseinheiten der 
einzelnen Halbleiterebenen den entsprechenden Anforderungen entsprochen 
werden. 

45 Beispielsweise ist fur die vorgeschlagene Architektur eine Ebene von 
Logikhalbleiter strukturen und eine weitere Ebene von 

Speicherhalbleiterstrukturen vorzusehen, die fttr diese Anforderungen geeignet 
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sind. Wahrend die irregular en und wenig redundanten Logikhalbleiterstrukturen 
eine vergleichsweise hone Fehlerqubte mit holier Verlustleistiing aufweisen, 
k6nnen Speicherhalbleiterstrukturen vergleichsweise redundant mit niederer 
Fehlerquote und durch geeignete Speicherverfahren {2. B. DRAM) auch mit 

5 geringer Verlustlei stung implementiert werden . Es wird explizit darauf 

hingewiesen, daS es mdglich ist, Felder vorzusehen, bei welchen nicht alle 
Speicherplatze und/oder alle Logikhalbl ei ter s truktur en voll funktional sind; 
es ist lediglich erf order lich, Mindes tanf orderungen sicherzustellen und/oder 
eine ordnungsgemafte Verwaltung. Redundanzen sind bevorzugt fur beide 

10 Strukturen separat zu betrachten. 

Die Aufbringung der mehrfach ubereinander liegenden Halbleisterstrukturen 
kann nach unterschiedlichen Verfahren erfolgen. Nebeh dem bereits 
beschriebenen Verfahren des Aufbringens einer weiter en Halbleiterebene uber 

15 einer Is olierschicht , was z. B. durch Aufdampf en und/oder Auficris tall is ier en 
erfolgen kann, sind auch thermische Oder mechanische Verbindungen moglich, 
indem z. B. die aufzubringende Siliziums truktur auf gelfitet ■ oder aufgeklebt 
wird. Zum AnflBten eigenen sich beispielsweise auch Verfahren, die aus den 
Technologien zum Verbinden von Halbleiter chips mit Gehausen bekannt sind. 

20 Dabei handelt es sich beispielsweise urn Reflow-Lfltung oder Thermokompression. 
Prinzipiell sind auch die einf ache mechanische Verbindungsmethoden raOglich, 
wobei sodann die Verdrahtung beispielsweise per Wirebond erfolgen kann. 
Voraussetzung hierfur ist, dass die Siliziums truktur en unterschiedliche 
Grofien aufweisen, sodass die Drahte von einer Siliziums trukturoberflache zur 

25 nach s ten gedrahtet werden kOnnen und, dass die Anzahl der Verbindungen 
vergleichsweise gering ist, damit diese mittels Wirebond noch realisiert 
werden konnen. 

Zur Optimierung der Ausbeute kann insbesondere das Redundanz verfahren nach DE 

30 197 57 200.6-33 angewendet werden, Es soil erwahnt sein, dass das Verfahren 
nach DE 197 57 200.6-33 fur alle PABs vorgesehen werden kann, also z. B. ftir 
ALU- PAEs genauso wie fur RAM-PAEs. Mit anderen Worten kOnnen ftlr samtliche 
PAEs das in DE 197 57 200.6-33 beschriebene Redundanzverfahren angewendet 
werden. Auch die dortigen Textverfahren sind implement ierbar . 

35 Fur PAEs mit hauptsSchtlich f eingranularen Strukturen, also z. B. Speicher 

(RAM-PAEs) Oder FPGAs ist es von Vorteil, diese f eingranularen Strukturen mit 
einer entsprechend f eingranularen Redundanz zu versehen, d. h. nicht oder 
nicht nur die RAM-PAE oder eine eine FPGA-S truktur aufweisende PAE mit einer 
redundanten PAE zu versehen, sondem die feingranulare S truktur selbst mit 

40 Redundanz zu versehen. Das heisst, dass beispielseise den Speicherzellen 

(bzw. FPGA- Zellen) redundante Speicherzellen (bzw. FPGA- Zellen) zugeordnet 
werden. Die Verbindungen (Leitungen, Busse, etc.) zwischen den jeweiligen 
Zellen sind dann entsprechend an die Erf ordernisse einer redundanten Struktur 
angepafit. Der Aufbau redundanter Strukturen ftlr feingranulare Zellen, wie z. 

45 B. Speicher oder FPGAs ist durch den Stand der Technik bereits bekannt. Fur- 
das Verstandnis von Ausgestaltungsdetails wird auf diesen verwiesen. 
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Die Verlustleistung la£t sich nach den Verfahren von DE 196 51 075.9-53 und 
DE 101 35 '210.7-53 erheblich minimi eren, wbdurch sehr hone. 
Integrationsdichten ermdglicht werden . 

5 Es soil darauf hingewiesen werden, dass die Anzahl der ubereinanderliegenden 
Halbleitersturkturen keineswegs auf zwei begrenz t 1st. Mit for tschrei tender 
technischer Entwicklung und Optimierung ist eine steigende, auch sehr grofce 
Zahl von tlbereinanderliegenden Ebenen realisierbar . 

. 10 Die Ebenenauf teilung mu£ dabei, weder bei einer zweilagigen, noch bei einer. 

mehrlagigen Struktur auf eine ALU- Speicher -auf teilung limltiert sein. Bereits 
bei zweilagigen Struktur en kann es sinnvoll sein den Speicher zusammen mit 
den ALUs in eine Lage zu legen und die and ere Lage komplett f Or die 
Bussysteme oder die Bus syst erne und IO-Ans teuerungen ( IOAGs ) zu verwenden. Die 
15 Bussysteme k5nnen dabei tiber die einfache Verdr ahtung hinaus bevorzugt auch 
die Schaltelemente (Multiplexer, Transmission-Gates, etc.) und/oder 
Vers tarker el entente (Treiber, etc.) und/oder Synchronisationselemente 
(RDY/ACK-Steuerung) , die jeweils Halble iter struktur en zu der en Realisierung 
benOtigen en thai ten. 

20 Desweiteren kann es sinnvoll sein, eine Ebene fur die Konf igurations speicher 
und/oder Konf igurationsregister und/oder CT und der en Speicher vorzusehen. 

Figur 6 zeigt eine Xmplementierung einer ROP-PAE. Architektonisch wurde die 
RAM-PAE innerhalb der ALU-PAE implementiert . Der gesamte Regis tersatz 

25 (R0..Rn, Rpp, Rsp, Rfp, Rap) ist in der ROP-PAE. untergebracht . Zugriffe auf 
die Register durch die ALU sind schnell und mit geringem Auf wand moglich. 
Adressen und Daten kdnnen direkt von der ALU an den Speicher fiber tragen 
werden, ohne ein Bussystem aufierhalb der ROP-PAE wie z. B. 0105 zu bentttigen. 
Bevorzugt weist eine ROP-PAE einen oder mehrere dedizierte IO-Channel zur 

30 DatenUbertragung mit der Peripherie auf (bei spiel sweise 0601, 0602). 

Datenverbindungen zu den restlichen PAEs kdnnen wie bereits bekannt durch 
FRBG und/oder BREG realisiert werden. Hier angedeutet durch den Leseport 0603 
und Schreibport 0604. 

Bevorzugt sind ROP-PAEs bereits intern als Sequenzer ausgebildet und weisen 
35 damit bereits eine interne Rttckkopplung des ALU-Ausgangs auf die Register 
auf . Optional kann dies auch durch die Verwendung eines ROP-PAE externen 
Busses (z.B. 0105) und einer RQckkopplung durch ein BREG, wie bereits bekannt 
erfolgen (0605). 

40 Figur 7 zeigt verschiedene Aufbauvarianten von Halbleiterstapeln: 

Figur 7a zeigt einen einfachen Aufbau mittels Wirebond Verbindungen zur 
DatenUbertragung (0701), bei welchen zwei Dice (0702, 0703), also zwei Chips, 
aufeinander montiert sind. Ein Chip besteht stark vereinfacht aus einer 
Halbleiterebene zur Realisierung von Transistoren (z. B. Silizium, 0704), 

45 mehreren Me tall lag en zur Realisierung von Verbindungsleitungen (z. B. 

Aluminium und/oder Kupfer; dargestellt sind 3 Lagen 0705a, b,c), die jeweils 
durch eine Isolierschicht untereinander und gegentiber 0704 elektrisch 
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getrennt sind, und eine obere, besonders widerstandsfahigen Isolierschicht 
0706. In die Isolierschichten sind Durchgahgsieitungen aus Metall zur 
elektrischen Verbindung der einzelnen Ebenen, sogenannte Vias, eingeftigt. 

5 In Pigur 7b Bind die beiden Dices mittels einer Art Flip-Chip-Technologie 
miteinander verbunden, wobei die Obertragung von Si goal en durch sogenannte 
Bumps nach dem Stand der Technik erfolgt. Zusatzlich zu den durch die Flip- 
Chip-Technologie geg ebenen Moglichkeiten des AnschluS von Bumps (0711) auf 
der jeweils obersten Metalllage soil hier die besondere erfindungsgemafie 

10 Ausgestaltung gezeigt werden, die Bumps unterhalb der Halbleiterschicbt (z.B. 
Silizium) zu kontaktier en . Dazu werden elektrische Verbindungen (z.B. 
Aluminium oder Kupfer) , also Vias (0712), durch die Siliziumschicht nach 
unten geftihrt. Die Durcbfflhrung erfolgt bevorzugt durch Atzen von 
entsprechenden LSchern in die Halbleiterebene. Zwischen den Verbindungen . und 

15 der Halbleiterschicbt wird eine Isolieruhg eingeftigt. 

Die DurchfOhmng kann wie bei Figur 7d angedeutet entweder direkt durch die 
Halbleiterschicbt erfolgen oder es werden, wie bevorzugt, zunScnst Wannen 
(0731) in die Halbleiterschicbt geatzt, die mit einer Isolierung gefttllt 
werden und in welche dann die Vias eingebracht werden. 

20 

Figur 7c zeigt die besonders bevorzugte Variante zur Realisierung von 
Halbleiterstapeln. Oberhalb der obersten Isolierschicht (0721) einer ersten 
Halbleiterstruktur, die in diesem Fall dtinner ausfallen kann, wird eine 
weitere Halbleiterebene (0722) aufgebracht. Dazu wird die Isolierschicht 

25 (0722) zunachst durch Atzen und/oder Schleifen mttglichst eben gemacht. Das 
Aufbringen der Halbleiterschicbt kann durch Aufdampfen, Auf Ziehen von 
Kris tall en oder bevorzugt durch Auf kleben oder klebeahnlichen Verbindungen 
aufgebracht. Wesentlich, v. a. bei der Verwendung von Verklebungen ist, dass 
durch die aufgebrachte Halbleiterstruktur und das Verbindungsmaterial (z.B. 

30 Klebematerial) durchgeatzt werden kann. Die Durchatzung ist erf orderlich, urn 
Kontakte, wie in Fig. 7b beschrieben zu den Vias in der darunterliegenden 
. Isolierschicht zu ftihren. 
Die Durchftihrung der Kontakte erfolgt gemaS Figur 7d z. B. durch das Einatzen 
.schmaler. Kanale, in die ein Isoliermaterial eingebracht wird. Danach wird in 

35 einem weiteren Schritt in das Isoliermatierial ein schmaleres Via eingefttgt, 
indem z. B. zuvor in dem Isoliermaterial ein Loch entsprechenden Durchmessers 
z. B. durch Atzen erzeugt wurde. 

Das bevorzugte Verfahren sieht das Atzen grosserer Wannen (0731) vor, welche 
mit Isoliermaterial gefilllt werden. In die Wannen werden dann ggf . mehrere 
40 Vias (0712) wie beschrieben eingeftigt. 

Die Figuren 7e,f,g,h zeigen verschiedene bevorzugte funktionale Aufteilungen 
solcher Halbleiterstapel. Die Halbleiterebene ist jeweils schraffiert 
dargestellt und die Isolierschicht durch dicke Umrandung . Dazwischen liegen 
45 die Metalllage. Wie in Fig. 7g,h angedeutet ist die Konstruktion nicht auf 2 
Stapel beschrankt, ebenso sind grttSere Stapel, z.B. rait 3,4, oder mehr Ebenen 
mdglich. 
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Die mehrf ache teschri ebene Auf trennung zwischen Speicher und ALUs ist in Fig. 
7e dargestellt. 

Fig. 7f zeigt die Trenriung der Bussysteme mit den notwendigeh Schalteinheiten 
5 und der lO-Struktur von den ALUs und Speichern, die sich in diesem Beispiel 
in derselben Ebene befinden. 

In Fig. 7g liegen auf der untersten Ebene die ALUs. Auf oberster Ebene liegen 
die Speicher und ggf. die Treiber der 10. Somit sind die Strukturen mit hoher 
Verlustleistung an den au£eren Randera der Stapel untergebracht . Besonders 
10 hierfttr wird Schutz beansprucht, da dadurch eine besonders optimale 

Warmeabfuhr roBglich ist. Die Bussysteme und deren Schalteinheiten sind in der 
mit tier en Ebene untergebracht. 

In dem Beispiel Fig. 7h sind in den mittlereri Ebenen verlustleistungsarme 
Busse und Speicher untergebracht. ALUs und die besonders energieaufwendigen 
15 10 sind zur optimalen Warmeabfuhr in den Randem untergebracht. 

IOx-PAEs 

Aus DE 199 26 538.0 sind Speicher (lORAM-PAEs) mit einem dedizierten 

Anschluss an externe Einheiten wie z.B. Peripherie und/oder Speicher bekannt. 
20 Weiterhin sind aus DE 196 54 595.1-53 und DE 102 06 653.1 dedizierte 

Einheiten (z. B. Interface-Baugruppen (IBG) ) zum Anschluss von extemen 

Einheiten wie z. B. Peripherie und/oder Speicher bekannt. 

Beide Verfahren weisen das Problem auf, dass ein zusatzlicher Aufwand zur 

Datenkommunikation zwischen PAEs, insbesondere datenverarbei tender und/oder 
25 datenberechnender PAEs und extemen Einheiten betrieben werden muss, indem 

die Daten explizit zwischen den PAEs und den IBGs und/oder lORAM-PAEs 

Ubertragen werden muss en. 

Es wird nunmehr erf indungsgemaS vorgeschlagen und wie bereits vorstehend 

30 mehrfach erwahnt fur beliebige PAEs, insbesondere jedoch fur 

datenverarbei tende und/oder datenberechnende PAEs (z. B. ALU- PAEs nach DE 196 
51 075.9-53 , IPAEs, ROP-PAEs) und datenspeichernde PAEs (RAM- PAEs nach DE 
100 50 442.6 ) einen oder mehrere dedizierten Anschlusse (IO-Channel) an 
externe Einheiten wie z. B. Peripherie und/oder Speicher vorzusehen. Dadurch 

35 ist eine direkte Kommunikationsmdglichkeit der PAEs, die nachfolgend IOx-PAEs 
genannt werden, und extemen Einheiten gegebeh. Der Vorteil dieser 
Architektur liegt darin, dass die Verbindung des Arrays aus PAEs (PA) mit der 
Peripherie (externem Speicher und/oder IO-Einheiten) erheblich effizienter 
aufgebaut werden kann. Die bestehenden konfigurierbaren Bussysteme der PAEs 

40 untereinander (BUS) mOssen nicht mit den IO-Datentransfers belastet werden. 
Desweiteren kann bei einer entsprechenden Ausgestaltung des I0-Channel die 
Adressierung der Daten fOr oder einzelne PAEs sehr viel einfacher 
durchgefUhrt werden, als dies mittels des BUS moglich ware. 
Dies kann bevorzugt dadurch realisiert sein, dass jede an einen IO-Channel 

45 angeschlossene Einheit eine eigene eindeutige Adresse besitzt. Mittels dieser 
Adresse kann jede Einheit explizit und einfach angesprochen werden, indem die 
Adresse tlber den IO-Channel tlbertragen wird und jede Einheit diese Adresse 
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rait ihrer eigenen vergleicht. Wenn die Adressen ttbereinstimmen, ist die 
Einheit adressieft und die Daten Bind fur diese Eiiiheit bestimmt. 
Bevorzugt kann jede Einheit nicht nur die Zieladresse, also die Adresse der 
Einheit fur die die Daten bestimmt sind, sondern auch ihre eigene Adresse 
5 fiber tragen, urn eine Identif ikation des Senders zu erraoglichen. 

Besonders effizient kann das Vorsehen von IO-Channels fUr nur eine Teilmenge 
aller PAEs sein. Beispielsweise bietet es sich an, nur Streifen von PAEs rait 
IO-Channel-Erweiterung innerhalb einer Anordnung von PAEs (PAE- Array, pa) 
10 vorzusehen. Dadurch wird eine verbesserte Flachen- und Kostenef f izienz. 
gegenuber der Implementierung der IO-Channel-Erweiterung in alle PAEs 
erreicht. 

PAEs, die besonders hohe Koramunikationsanforderungen aufweisen, konnen 
15 applikationsabhangig auch an raehrere IO-Channel angeschlossen sein. 

Die dedizieren IO-Channels konnen dabei auf unterschiedlichen Bussystemen 
aufgebaut sein, z. B. insbesondere nach DE 197 04 742.4 Oder als parallel es 
Standardbussystera wie Rapid- 10, PCI, AMBA oder serielles Standardbus system 
20 wie USB, Firewire, Ethernet. 

Besonders leistungsf ahig kann die Implementierung von IO-Channels in PAEs 
dann sein, wenn diese nicht direkt an die extemen Einheiten gefuhrt sind, 
sondern zunachst an eine IO-Verwaltungseinheit (IOAQ) , die ahnlich dem 

25 Protokollkonverter nach DE 102 06 653.1 oder der IOAG nach DE 196 54 595.1- 
53 aufgebaut sein kann. Der Vorzug liegt darin, dass ein einf aches internes 
Busprotokoll zur Steuerung der IO-Channels verwendet werden kann. Eb ens o wird 
nur eine geringe "Intelligenz" in jeder ein en 10 -Channel aufweisenden PAE 
benatigt, wodurch die PAEs jeweils flachenmafiig klein und xinaufwendig zu 

30 programmieren sind. 

Die eigentliche Verwaltung und Ansteuerung der extemen Einheiten wird in den 
lOAGs durchgefuhrt, die durchaus grofier und aufwendiger ausgestaltet sein 
konnen. 

35 Die IOAGs konnen zur Erftlllung ihrer Aufgabe selbst eigene Sequenzer und/ oder 
Mikrokontroller und ggf . auch eigenen Speicher aufweisen. Insbesondere kann 
die IOAG auch Speichermanagement einheiten und Adressubersetzungseinheiten 
aufweisen. Je nach Applikation konnen Interruptkontr oiler wie z. B. nach dem 
Stand der Technik bekannte (18259) in der IOAG implementiert sein, die 

40 Interrupts ggf. auf Triggersignale nach DE 197 04 728.9 ubersetzen. 

SIMD PAES 

Bei der Verwendung von rekonfigurierbaren Technologien zur Verarbeitung von 
45 Algorithmen entsteht ein wesentliches Paradoxon: (1) es sind, um eine 

mOglichst hohe Rechenlei stung zu erhalten, koznplexe ALUs erforderlicb, wobei 
der Auf wand fur die Reconfiguration minimal sein sollte; (2) es sollten die 
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ALUs mdglichst einfach und f eingranular sein, urn eine ef fiziente 
Datenverarbeitung auf Bitebene zu ermoglichen; (3) es sollte die 
Rekonf iguration und Da tenverwal tung derart intelligent und schnell erfolgen, 
dafi sie effizient und einfach zu prbgramraieren ist. 

5 

Bisherige Technologien verwenden entweder a) sehr fcleine ALUs mit wenig 
Rekonf igurationsuntersttltzung (FPGAs) und sind auf Bitebene effizient oder b) 
grofie ALUs (Cameleon) mit wenig Rekonf igurationsuntersttitzung, oder c) eine 
Mischung aus grofien ALUs und kleinen ALUs mit Rekonf igurationsuntersttitzung 
10 und Datenverwaltung (VPUs) . 

Da die VPU-Technologie die leistungsf ahigste Technik darstellt, soli auf ihr 
aufbauend ein optimiertes Verfahren geschaf f en werden. Es soil ausdrttcklich 
darauf hingewiesen werden, dafi dieses Verfahren ebenf alls fttr die anderen 
Architekturen eingesetzt werden kann. 

15 

Der Flachenaufwand zur ef fizienten Steuerung von Rekonf igurationen ist mit 
einer Menge von ca. 10.000 bis 40.000 Gattern pro PAE vergleichsweise hoch. 
Unterhalb dieser Gattermenge las sen sich in der Regel nur einfache 
Ablaufsteuerungen realsieren, die die Progr ammi erbarke i t von VPUs erheblich 
20 einschranken und eine Verwendung als General Purpose Prozessor erschweren. 
Sofern auf eine besonders schnelle Rekonfiguration abgezielt wird, mussen 
zusatzliche Speicher vorgesehen werden, wodurch die erforderliche Gattermenge 
nochmals erheblich ansteigt. 

25 Urn ein ordentliches Verhaltnis zwischen Rekonf iguratioiisaufwand und 

Rechenleistung zu erhalten, ist- somit der Einsatz von grofien ALUs (viel 
Funktionalitat und /oder grofie Bitbreite) zwingend er f order lich. Werden die 
ALUs jedoch zu gro&, sinkt die nutzbare parallele Rechenleistung pro Chip. 
Bei zu kleinen ALUs (z. B, 4-bit) ist der Aufwand zur Konf iguration . 

30 aufwendiger Punktionen (z.B. 32 -bit Hultiplikation) zu hoch. Insbesondere der 
Verdrahtungs aufwand wachst in kommerziell nicht mehr sinnvolle Bereiche. 

SIMP Rechenwerke 

35 Um ein ideal es Verhaltnis zwischen der Verarbeitung von kleinen Bitbreiten, 
Verdrahtungsaufwand und der Konf iguration aufwendiger Funktionen zu erhalten, 
wird nun der Einsatz von SIMD-Rechenwerken inner halb von ALU-PAEs {also 
insbesondere der in dieser Erfindung offenbarten PAEs, ebenso wie in PAEs 
nach DB 196 51 075.9-53 und DE 199 26 538.0 ) vorgeschlagen . Dabei werden 

40 Rechenwerke der Breite m derart zerteilt, dafi n einzelne Blocke der Breite b 
= m/n entstehen. Durch Konf iguration wird je Rechenwerk vorgegeben, ob ein 
Rechenwerk unzerteilt arbeiten soil, oder ob das Rechenwerk in einen oder 
mehrere Blocke, jeweils gleicher Oder unterschiedlicher Breite zerlegt sein 
soil. Mit anderen Worten kann ein Rechenwerk auch derart zerlegt sein, dafi 

45 inner halb eines Rechenwerkes unterschiedliche Wortbreiten zugleich 

konfiguriert sind (z.B. Breite 32-bit, zerlegt in 1x16-, 1x8- und 2x4-bit) . 
Die Daten werden derart zwischen den PAEs tlbertragen, dafi die zerlegten 
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Datenworte (SIMD-WORD) zu Datenworten der Bitbreite m zusammengefafit werden 
und als Paket uber das Netzwerk uiertragen werden. . 
Das Netzwerk ubertragt immer ein komplettes Paket, d.h. alle Datenworte 
innerhalb eines Pake tea * und werden nach dem bekannte Handshake-Verf ahren 
5 tibertragen. Einzelne Datenworte innerhalb des Paketes kttnnen dabei audi 

unbenutzt sein, d.h. keine Information en thai ten. Dies kann durch zusatzliche 
Statusleitungen und/oder Handshakes ignal en wie z. B. dem RDY/ACK Protokoll 
realisiert sein. 

10 

SIMP Bussvsteme 

Ftlr einen ef fizienten Einsatz der von SIMD-Rechenwerken ist eine flexible und 
ef fiziente TJmsortierung der SIMD-WORD untereinander innerhalb eines Busses 
Oder zwischen unterschiedlichen Bus sen erf orderlich. 

15 Die Busschalter nach Figur llkonneh der art modifiziert werden, dafi eine 
flexible Vernetzung der einzelnen SIMD-WORD mdglich ist. Dazu werden die 
Busse uber beispielsweise Multiplexer, Busschalter, Transmissiongates, Pass- 
Transistoren (nachfolgend unter dem Begrif f Multiplexer zusammengefaSt) 
entsprechend den Rechenwerken teilbar ausgelegt, der art dafi durch 

20 Konfiguration die Teilung bestimmt werden kann. Mit anderen Worten wird 

beispielsweise nicht ein Multiplexer der Breite m pro Bus verwendet, sondern 
n einzelne Multiplexer der Breite b = m/n. Es ist nunmehr moglich, die 
Datenbusse fur b bit Breite zu konfigurieren. Durch die Matrixstruktur der 
Busse (Figur 11) ist die Umsortierung der Da ten ebenfalls moglich, wie in 

25 Figur 12a dargestellt. 

Die Handshakes der Busse werden logisch der art verknupft, dafi ein gemeinsamer 
Handshake fQr den neu geordneten Bus aus den Handshakes der ursprunglichen 
Busse generiert wird. Beispielsweise kann ein RDY fur einen neu sortierten 

30 Bus aus einer logisch en UND-Verknttpfung aller RDYs der Da ten fur diesen Bus 
liefernden Busse generiert werden. Ebenso kann beispielsweise das ACK eines 
Da ten liefernden Busses aus einer UND-Verkntlpfung der ACKs aller Busse 
generiert werden, die die Da ten weiterverarbeiten. Prinzipiell sind bei der 
Implement! erung ge eigne te Verknupfungen dergestalt zu wahlen, dass diese den 

35 jeweils verwendeten Busprotokollen entsprechen. 

In einer ersten Aus f tihrungsvari ante f inden die Verknupfungen der Handshakes 
innerhalb eines jeden Busknotens statt. Dadurch wird es mSglich, einero 
Bussystem der Breite m, bestehend aus n Teilbussen der Breite b, bevorzugt 
40 nur ein Hand- shake- Protokoll zuzuordnen. 

In einer weiteren besonders bevorzugten Ausgestaltung werden samtliche 
Bussysteme in der Breite b ausgestaltet, die die kleinste realisierbare Ein- 
/Ausgabe Datenbreite b eines SIMD-Word entspricht. Entsprechend der Breite 
45 der PAE Datenpfade (m) be stent nunmehr ein Ein-/Ausgangsbus aus m/b = n 
Teilbussen der Breite b. Beispielsweise besitzt eine PAE mit 3 32bit 
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Eingangsbussen und 2 32 bit Ausgangsbusse bei einer kleinsten SIMD-Wortbreite 
von 8 tatsachlich 3x4 8bit Eingangsbusse und 2x4 8bit Ausgangsbusse.. 
Jeder der Teilbusse weist bevorzugt samtliche verwende ten Handshake- und 
Steuersignale auf, beispielsweise RDY/ACK und der Reconf ig-Trigger nach DE 
5 197 04 728.9 und ein globales Reset Signal, etc. 

Der Ausgang einer PAE versehdet bevorzugt dieselben Steuersignalen ftlr 
samtliche n Teil-Busse. Eingehende Quittierungssignale aller Teilbusse werden 
bevorzugt miteinander logisch verkntlpft, z. B. durch eine DND-Funktion . Die 
Bussysteme. k»nnen jeden Teilbus frei vers chal ten und unabhluigig routen. Die 
10 Bussysteme und insbesondere die Busknoten yerarbeiten und/ Oder verkntipf en die 
Handshake- Signale der einzelnen Busse unabhangig ihres Routings, ihrer 
Anordnung und Sortierung nicht. 

Bei in einer PAE eingehenden Da ten werden die Steuersignale samtlicher n 
Teilbusse derart miteinander verkntlpft, dass ein allgemeingttltiges 

15 Steuersignal quasi als BUssteuersignal fur den Datenpfad generiert wird. 
Beispielsweise koiinen in einer "dependend' Betriebsart RdyHold-Stufen fur 
jeden einzelnen Datenpfad eingesetzt werden und erst, wenn samtliche RdyHold- 
Stufen anstehende Daten signalisieren, werden diese von der PAE ubemommen. 
In einer •independend* Betriebsart werden die Daten jedes Teilbusses einzeln 

20 in Eingangsregister der PAE geschrieben und quittiert, wodurch der Teilbus 
sofort fur eine nachste Datenubertragung frei ist. Das Vorhandensein aller 
erforderlichen Daten von alien Teilbussen in den Eingangsregistern wird 
innerhalb der PAE durch geeignete logische Verkntipf ung der fur jeden Teilbus 
im Eingangsregister gespeicherten RDY-Signale detektiert, woraufhin die PAE 

25 mit der Da tenverarbei tung beg inn t . 

Der wesentliche daraus resultierende Vorteil dieses Verfahrens ist, dass die 
SIMD-Eigenschaf t von PAEs keinerlei besonderen Einf luS auf das verwendete 
Bussystem aufweist. Es werden lediglich mehr Busse (n) einer geringeren 
30 Breite (b) benotigt. Die Verschaltung selbst bleibt unbertthrt. Die PAEs 
verkntipf en und verwalten die Steuerleitungen lokal. Dadurch entfallt der 
zusaMbzliche Hardwareaufwand in den Bussystemen zur Verwaltung und/oder . 
Verkntipf ung der Steuerleitungen. 

35 Figur 11 zeigt einen mOglichen und besonders bevorzugten Aufbau einer 

Busstruktur fur VFU-Architekturen. Die Ausgabeschaltung einer Funktionszelle 
z. B. (PAE , FREO/BREO) (U03, entspricht 0803a,b) ist ttber einen vertikalen 
Bus mit dem horizontalen Bussystem (1102, entspricht 0105) verbunden. 
Entsprechend greifen die Eingabeschaltungen der Funktionszellen (1101, 

40 entspricht 0801, 0802) uber einen vertikalen Bus Inf ormationen von dem 

horizontalen Bussystem ab. In der Figur wird nunmehr verdeutlicht, wie ein 
derartiger Abgriff , bzw eine derartige Aufschaltung erfolgen kann. 
Wie in Fig. 11a dargestellt erfolgt das Aufschalten eines Ausgabebusses 
(1111) von 1103 auf 1102 durch ein 'Auftrennen" eines Busses des horizontalen 

45 Bussystems 1102 und das EinfOgen von horizontalen Schaltera (1112), die durch 
Switches, Transmission-Gates, Multiplexer Oder ahn lichen geeigneten 
Bauelementen realisiert sein kflnnen. Abhangig von dem Wert eines Dekoders 
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und/oder Konfigurationsbits (angedeutet durch das Schalter symbol 1113), das 
entsprechend der bekannten Kohf igurationsverfahr en bevorzugt in einem 
Konfigurationsregister der PAE angeordnet 1st und konflguriert wird, 
verbindet der Schalter entweder die beiden Half ten des horizon talen Busses 
5 1102 miteinander oder schaltet den Bus 1111 au£ die eine Halfte von 1102 auf , 
die andere Half te von 1102 ist dann unterbrochen und wird nicht 
weitergeleitet. Die Schaltung wird bevorzugt fur jeden Bus des horizontal en 
Bussystems verwendet. 

Figur lib zeigt die entsprechende Schaltung zum Abgrif f von Da ten von 1102 

10 und zur Weiterleitung derer an 1101. Ober vertikale Schalter (1122), die 
durch Switches, Transmission-Gates, Multiplexer oder a hn lichen geeigneten 
Bauelementen realisiert sein kGnnen, werden Daten bitweise von den Buss en des 
horizontalen Bussystems (1102) abgegriffeh und auf den vertikalen Eingangsbus 
(1121) zur Eingabeschaltung 1101 ubertragen. Die Ansteuerung der vertikalen 

15 Schalter, d.h. ihre Schaltfunktion, erfolgt durch Dekoder und/oder 
Konfigurationsbits (angedeutet durch die Schaltersymbole 1123), die 
entsprechend der bekannten Konf igurationsverfahren bevorzugt in 
Konfigurationsregistem der PAE angeordnet sind und konfiguriert werden. 
Fig. lib und bei entsprechender Modifikation auch Fig. 11a lassen ml 

20 Datenubergange zu, d.h. mehrere Busse kdnnen zu einem Bus zusammengefaSt 
werden, d.h. die Daten mehrer Busse werden auf einem Bus zusammengef uhr t . 
Fig. 11c zeigt die Busauf trennfunktion der horizontalen VFU-Bussysteme 
(1102) . Jeder horizon tale Bus einzeln und je fur sich kann an der 
Ausgabeseite der PAE-Xante aufgetrennt werden. Eine Auftrennung kann durch 

25 Multiplexer oder Schalter erfolgen, wie in Figur 11c angedeutet werden soil. 
Je nach Konfigurationsbit 1132, das bevorzugt fur jeden Bus des Bussystems je 
einzeln zur Verfugung stent, wird die Datenubertragung auf das 
danebenl i egende Bussystem (1131) freigeschaltet oder unterbunden. 
Typischerweise wird diese Funktion in den Schaltem nach Figur 11a 

30 realisiert, indem die Information des Konfigurationsbits 1132 an die Schalter 
(1112) des danebenliegenden Bussystems (1131) ubertragen wird und 
entsprechend die Schalter zur Weiterleitung ermachtigt (enabled) oder die 
Schalter sperrt (disabled) . 

35 Figur 12a zeigt ein SIMD-Bus system entsprechend Figur 11. Dargestellt ist ein 
vereinfachtes horizon tales Bussystem 1102, eine PAE Ausgabeschaltung 1103 und 
eine PAE Eingabeschaltung 1101. tfede Eingabeschaltung weist beispielhaft 2 
Eingabebusse der Breite 32 bit auf (1201, 1202), jede Ausgabeschaltung 2 
entsprechende Ausgabebusse (1203, 1204). Jeder der Busse (1201, 1202, 1203, 

40 1204) ist in 4 Teilbusse zu je 8-bit aufgeteilt, die wie dargestellt jeweils 
unterschiedlich und unabhangig geroutet werden konnen, einige der Teilbusse 
werden nicht verwendet (gepunktete Linie) . Die flexible Verschaltung wird 
dadurch erreicht, dass die Schalter nach den Figur en lla~c fur jeden Bus 
der art getrennt aufgebaut sind, dass je ein Teilbus von einem Schalter mit 

45 eigener Konf iguration verwaltef wird. Dadurch ist das Bussystem feingranular 
verschaltbar. 
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Figur 12b zeigt eine SIMD-Datenverarbeitung, bei welch er samtliche Busse 
(1211) dasselbe Handshake (1212) aufweisen. Die Busse werden innerhalb einer 
PAE in die Teilbusse getrennt und in den SIMD-ALUs (1213, 1214) getrennt 
verarbeitet. Die gemeirisamen Handshakes, steuern die Ablaufsteuerung (1215) 
5 der PAEs an, bzw. werden von dieser generiert. 

Figur 12c zeigt eine SIMD-Datenverarbeitung, bei welcher samtliche Busse 
vollkoinmen getrennt sind (1221) getrennte Handshakes (1222) aufweisen. Die 
Busse in den SIMD-ALUs (1223,, 1224) getrennt verarbeitet. Die getrennten 
10 Handshakes steuern die Ablaufsteuerung (1225) der PAEs an, bzw. werden von 
dieser generiert. 

Einsatz von FPGAs als ALU-Core 
15 In PACT13 ist bereits eine Architektur beschrieben, in welcher anstatt einer 
ALU eine FPGA oder FPGA-annliche Struktur in eine PAE integriert wird. Diese 
Struktur wird innerhalb einer PAE geraaS den FPGA Konfigurationsmethoden nach 
dem Stand der Technik konfiguriert, d. h. die erweiterten 

Konfigurationsverfahren nach PACT02, 04, 05, 10, 13, 17 finden auf die FPGA- 
20 Struktur keine Anwendung. Dadurch sind Auf wand und Kosten fur die 

Konfigurationssteuerung der vernal tnismaSig kleinen FPGA-Zellen gering. Die 
PAE allerdings, die. die FPGA-Zellen enthalt, verhalt sich gemafc des VFU- 
Konfigurationsverfahrens nach den o. g. Schrif ten. Dadurch- ist die FPGA- 
Struktur in der PAE- Struktur gekapselt und verhalt sich wie ein PAE-Objekt 
25 mit vielen Konf igurationsregistem. 

Dadurch lessen sich auch beliebige Operation en auf ein Array aus FPGAs 
abbilden. Gemafi DE 101 35 210.7-53 ist eine Mischung aus ALU-PAEs und FPGA- 
PAEs innerhalb einer VPU mttglich und durchaus sinnvoll. 

30 Es ist anhand des Anwendungsgebietes zu entscheiden, ob ein mehrf acher Satz 
an Konf igurationsregistem fur die FPGA-Zellen sinnvoll ist, da deren Anzahl 
sehr hoch ist. Gegebenenf alls werden Konf iguratiohsregis ter zum schnellen 
Umkonfigurieren einer FPGA- PAE gexnaB DE 196 51 075.9-53 , DE 199 26 538.0 
und insbesondere DE 100 28 397.7 Fig. 18 und 19 als Register-File oder F1FO- 

35 Struktur innerhalb der PAE realisiert und von dort aus in die FPGA-Zellen 
geladen . 

Es hat sich mittlerweile als besonders vorteilhaft her ausges tell t, wenn 
innerhalb einer ALU- PAE eine FPGA Struktur der ALU zugeordnet wird, indem die 
40 FPGA- Struktur vor und/oder nach und/ oder parallel zur ALU angeordnet wird. 
Bevorzugt ist eine Ausftthrung in welcher die FPGA-Struktur der ALU 
nachgeschaltet wird. 

Der Vorteil liegt darin, dass nur relativ kleine FPGA-Strukturen verwendet 
werden mttssen, da samtliche ari thine tischen Operationen weiterhin in der ALU 
45 ablaufen. Dadurch wird eine besonders hohe Kos ten/Performance Effizienz 

erreicht. Urn kleine Wortbreiten zu untersttltzen (4-bit, 8-bit, etc.), bietet 
es sich besonders an, die vorab beschrieben en SIMD-ALUs einzusetzen. 
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Durch die Nachschaltung von FPGA-Strukturen hinter einer ALU lassen sich 
insbesondere Correlatbren und pi^-Geheratoreh besonders effizient aufbauen- 

Der Eirisatz von VPU Architekturen bietet sich mi ttlerweile' insbesondere ftir 
5 den Ersatz von ASICs bei mittleren und niederen Sttickzahlen an. Dieses 
Einsatzgebiet der VPU Bausteine weist die Besonderheit auf , dass die 
Appl ikat ions f elder sehr klar def iniert sind und hauf ig nur einige wenige 
Applikationen auf den Bausteinen ausgeftihrt werden. Besonders diese 
Einsatzgebiete benetigen haufig feingranulare FPGA-Strukturen zur bitweisen 

10 Verarbeitung von Daten. 

Durch die Limit ierung auf wenige Anwendungen sind hier die moglichen 
Konfigurationen der FPGAs ebenfalXs sehr begrenzt und vorhersagbar. 
Es wurde erkannt, dass es beispielsweise insbesondere fur diese 
Einsatzgebiete lohnend ist, die Rekonf iguration der FPGA-Strukturen von der 

15 schnellen Rekonf iguration der grobgranularen Strukturen abzusetzten. Mit 

anderen Wort en werden ftir die FPGAs langsamere (z. B. herk&nmliche serielle) 
Rekonf igurationsverfahren verwendet, die auSerst kosten- und f lacbenef f izient 
realisierbar sind. 

Dazu kann (1) ein vollkoramen separates Konfigurationssystem bestehend aus 
20 Bussystem und Konf igurationskontrollern aufgebaut werden, wie dies von FPGAs 
nach d era Stand der Technik bekannt ist. (2) konnen die 

Konfigurationsressourcen der VPU Technologie benutzt werden, ohne dass jedoch 
Ressource fur besondere beschleunigende Massnahmen zur Verftigung gestellt 
werden, Beispielsweise kann der Zugriff auf den FILMO nach DE 196 54 593.5-53 

25 , DE 198 07 872.2 ftir FPGA-Strukturen ausgeschlossen sein, ebenso wie das 

Vorhandensein von Konf igurationsregisters tacks nach DE 100 28 397.7 Oder wie 
nachfolgend beschrieben. Ebenfalls kann die Untersttitzung der schnellen Wave- 
Rekonfiguration nach DE 199 26 538.0 , DE 100 28 397.7 entfallen. Es ist 
etwa moglich, eihem FPGA-Array eine PAE zur Umkonf igurierung zuzuordnen . Hier 

30 raufi lediglich die PAE dazu konf iguriert werden, die FPGA-Struktur zu laden, 
was wie vorstehend beschreiben, durch PAB-gesteuerten, eigens tandigen Zugriff 
auf Daten von auSen geschehen kann. 

Insbesondere bietet es sich aus Kostengrtinden an anstatt der mehrfach 
rekonf igurierbaren Architekturen ressourcensparende "einmal konfiguriexbare" 

35 Architekturen einzusetzen. Die VPU- Bausteine werden dann einraal vor ihrer 
Aus lief erung an den Runden oder beim Kunden bzw. durch den Kunden 
personalis iert, d. h. die FPGA-Strukturen werden auf ihre durchzuftihrende 
Funktion konf iguriert . Die Funktion der FPGA-Strukturen ist sodann im 
weiteren unabanderlich, wahrend samtliche verbleibenden Funktionen, wie die 

40 der ALUs und der en Vernetzung, weiterhin vollstandig lauf zeitrekonf igurierbar 
entsprechend der VPU-Technologie ist 

Als "einmal konf igurierbare" Technology en bieten sich besonders die bekannten 
ROM, EPROM, EEPROM, FLASH basierenden Verfahren an. Es soil insbesondere 
erwahnt sein, dass sich die bekannten Fuse und Ant if use- Verfahren (z.B. 
45 Atmel, Accel, Quicklogic) besonders zur Realisierung der ar tiger "einmal 
pr ogrammierbar er " FPGA-Strukturen eignen. 
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Auf den prinzipiellen Aufbau derar tiger Strukturen soli hier nicht welter 
eingegangen wefden/ da dieser durch den eiiischiagigen Stand der Technik, 
insbesondere den Patenten der o. g. Firmen, hinreichend bekannt ist. 

5 Figur 8 zeigt beispielhaft eine erfindungsgeroaEe PAE. Dargestellt ist der 
Datenpfad der PAE. Die Verbindung zu dem Bus system 0105 wird durch die 
bevorzugt Register enthaltende Eingabebaugruppe 0801 und 0802 und die 
ebenfalls bevorzugt Register enthaltende Ausgabebaugruppe 0803 real isiert. 
Der ALU (0804) nachgeschaltet ist eine Funktionseinheit aus feingranularen 

10 FPGA-Zellen (0805) , die uber einen Busstruktur miteinander verbunden sind. 
Der Ausgang von 0804 wird auf diese Busstruktur auf geschaltet, die 
- Busstruktur wiederum ist mit 0803 verschaltet. Optional und bevorzugt kann 
mittels eines Multiplexers ein Brypass des Ausgangs von 0804 direkt auf die 
Ausgabebaugruppe 0803 an 0805 vorbei geschaltet werden. 

15 In die FPGA-Zellen kdnnen mehrere Stufen Logik konf iguriert werden, 

insbesondere samtliche oder einige der folgenden Funktionen: Multiplexer, 
AND, OR, XOR, NOT Funktionen, Halb- addierer, Vergleicher, Schieberegister, 
Register, Boolsche Lookup -Tabell en . 

Die FPGA-Zellen (0805) kdnnen durch den Konf igurationsbus (0404) der PAE 
20 konf iguriert werden. Bevorzugt warden besondere konf igurationsbeschJ eunigende 

Baugruppen, wie z. B. Konf igurationss tacks (0406) nicht zur Konf iguration von 

FPGA-Zellen benutzt. Diese Baugruppen werden ggf . fur derartige 

Konf igurationsda ten passiv geschaltet oder die Konfigurationsdaten werden an 

ihnen vorbeigeleitet. 
25 In einer besonderen Ausgestaltung ist eine permanente einmalige Konf iguration 

der FPGA-Zellen unter Verwendung von ROM-Element en wie z. B. EPROM, EEPROM, 

Flash-ROM oder Fuse-/Antifuse-Technologien vorgesehen. 

Figur 9 zeigt mOgliche erfihdungsgemaEe Ausgestaltungen von PAEs. Es soli 
30 ausdrUcklich darauf hingewiesen werden, dass die Ausgestaltung in Figur 9a 
und die in Figur 9b auch gleichzeitig zusatnmen in einer PAE implementiert 
sein kdnnen. 

Figur 9a zeigt den Anschlufi eines Registerfiles (0901) (z.B. R0..Rn) an einen 
35 Kern (0902), der beispielsweise aus einer ALU wie 0804 oder einer ALU (0804) 
und FPGA-Zellen (0805) bestehen kann. 

Die Ergebnisdaten des Kerns werden zu den Regis tern 0901 gefOhrt und dort je 
nach Operation eingespeichert . Die Register 0901 werden Obex Muliplexer 
(0903, 0904) je nach durchzufuhrenden Operation auf die Eingange der ALU 
. 40 gefuhrt. 

Figur 9b zeigt eine ahnliche Struktur, bei welch er eine zusatzliche 
Aufschalteinheit (0911) fur einen dedizierten globalen Bus (0912) (z.B. IO- 
Channel) implement iert ist. Die Ergebnisdaten des Kerns werden zu der 
45 Aufschalteeinheit 0911 gefuhrt und dort je nach Operation auf den globalen 
dedizierten Bus (0912) ubertragen. FUr die PAE bestimmte Daten von 0912 
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werden uber Muliplexer (0903, 0904) je nach durchzuftthrenden Operation auf 
die Eingange der ALU geftinrt . 

Optional kann die Auf schalteeinheit 0911 Obex die Busauf schalteeinheiten 0913 
und 0914 Daten direkt von dem Bussystem 0105 lesen oder auf dieses 
5 tlber trag en. 

Figur 10a zeigt die Verwendung von dedizierten global en Bussystemen innerhalb 
eines Arrays aus PAEs (1001) . Insoweit entspricht die Darstellung des PAs aus 
Figur 1 (0101) . Jewells eine Menge von PAEs (1001) ist an die globalen 

10 dedizierten Bussysteroe 1002, 1003, 1004 angeschlossen und kann Daten auf 
diese Send en oder von diesen Qnpfangen. Die Datentlbertragung kann sowohl 
zwischen den PAEs, als auch zwischen PAEs und IO stattf inden. Es ist . 
dargestellt, dass PAEs auch an mehrere globalen dedizierten Bus syst erne 
gleichzeitig angeschlossen sein kcnnen, wahrend andere PAEs m&glicherweise 

15 keinen Anschluss aufweisen. 

Figur 10b zeigt beispielsweise den AnschluS eines globalen dedizierten Busses 
(beispielsweise 1002 oder 1003 oder 1004), der innerhalb des Arrays aus PAEs 
(0101) mit einigen PAEs (1001) verbunden ist, an aufierhalb des 0101 liegende, 
ggf . auch bausteinexteme Baugruppen . Die Baugruppen kSnnen beispielsweise 

20 Peripherie (1011) und /oder Speicher (1012) sein. Zum Anschlufi der au&erhalb 
1 legend en Baugruppen (1011, 1012) kann ggf. eine Anpassung der Signale (z. B. 
Spannungen: CMOS, TTL, LVDS, etc.) stattf inden. 

Figur 10c zeigt ein Bei spiel fur den Anschlufi eines globalen dedizierten 
25 Busses (beispielsweise 1002 oder 1003 oder 1004), der innerhalb des Arrays 
aus PAEs (0101) mit einigen PAEs (1001) verbunden let, an eine Interface- 
Baugruppe (1021) . Die Inter f ace-Baugruppe Obersetzt die Protokolle und/oder 
Signale des in tern en dedizierten Busses auf einen oder mehrere aufierhalb 
liegenden Busse. In dem aufgezeigten Beispiel sind 2 auSerhalb liegende Busse 
30 (1022, 1023) implement! ext. Die Bussysteme sind beyorzugt unterschiedlicher 
AUsgestaltung, beispielsweise kann 1022 ein Speicher bus system fur Speicher 
(1024) wle SDR-RAMs, DDR-RAMs , RAMBUS o.a. sein, wahrend 1023 ein 
Per ipheriebus system fur Peripherie- und/oder IO-Gerate (1025) darstellt, wie 
z. B. PCI oder ein serielles Protokoll wie USB, FireWire, Ethernet. 

35 

Konfioruration komplexer Rechenwerke 

Komplexe Rechenwerke (z. B. Floating-Point Rechenwerke) kcnnen durch die 
geeignete Verschaltung und Gruppierung von konf igurierbaren Zellen (PAEs) 
40 mttglicherweise auch unterschiedlicher Bauart (RAM- PAEs, ALU- PAEs, Bus sen) 
realisiert werden. 

Beispielsweise kann ein Floating-Point Rechenwerk durch eine geeignete 
Verschaltung yon mehreren ALU- PAEs, die die arithmetischen Opexationen Ober 
Exponent und Mantisse durchfuhren erreicht werden. Bevorzugt werden den ALU- 
45 PAEs die in der VPU des Anmelders (XPP-Technologie ) integrierten Forward- und 
Backward-Register (FREG/BREO) zugeordnet, urn die notwendigen Normierungen 
durch Schiebeoperationen der in den FREG/BREG angeordneten Barrel-Shifter 
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durchzufuhren. Damit las sen sich Floating-Point Rechenwerke bei Bedarf auf 
Basis der Integer-AiiUs mit hoher Fiachenef fizienz/aurbauen. 
Bin Vorteil des Verfahrens liegt darin, dass keine Silizium-Flache fur fest 
integrierte Floating-Point Rechenwerke verwendet werden muss: Da Floating- 
5 Point-Operationen relativ zu den Integer-Operationen nur s el ten gebraucht 
wird, steigt damit das Kosten/NUtzen-Verhaitnis erheblich an. 
Compiler, die Hochsprachenprogramme auf eine VPU ttbersetzen, konnen durch 
Makroexpansion und/oder mittels Lauf zeit-Bibliotheken entsprechende 
vorgefertigte komplexe Strukturen in den Maschinencode (z. B. NML) 
10 ubemehmen. 

FUr Maschinencode- Programme (z. B. NML) bieten sich besonders Library-Calls 
auf Bibliotheken an, die die entsprechenden komplexen Funktionen vorgefertigt 
enthalten. 

15 

Statemachines tlber RAM-PAEs 

Mit einera Array aus PAEs verbundene RAM-PAEs konnen zum Aufbau von Sequenzern 
eingesetzt werden. Das Grundprinzip beruht darauf , dass Ausgangsdaten eines 
Speichers auf dessen Adresseingang zurttckgekoppelt wird. Die Ruckkoppluug 
20 erfolgt bevorzugt uber ein taktgesteuertes Registers. Dadurch entsteht ein 
Sequenzer, dessen jeweils nachfolgender Zyklus durch den jeweils aktuellen 
Zyklus vorgegeben ist. 

Telle der Ausgangsdaten ( CONTROL- Si gnal e ) kdnnen nunmehr an andere Baugruppen 
und/oder Funktionszellen (PAEs) und/oder auch an exteme Gerate ubertragen 

25 werden, um dort bestimmte Vorgange auszulosen. Besonders bevorzugt sind zwei 
ftbertragungsarten, die zuroeist gemeinsam angewendet werden: 
a) die ttbertragung uber ein en Datenbus, bevorzugt inbesondere als SIMD-Bus 
gemafi der vorstehenden Erlauterung ausgestaltet, wodurch eine teilweise 
flbertragung der Ausgangsdaten besonders efficient realisierbar ist. 

30 b) die Obertragung uber einen Triggerbus, dessen bevorzugte Ausgestaltung und 
Arbeit sweise in PACT 08 beschrieben ist. fiber Triggerbusse kGnnen Zustande und 
Bedingungen zur Ablaufsteuerung von Baugruppen und/oder Funktionszellen 
(PAEs) und/oder auch extemen Geraten besonders effizient ubertragen werden. 

35 Der Aufbau der Eingangsadressen, bzw. Ausgangsdaten ist wie 
folgt(Darstellung: hoherwertige Bits ... niederwertig Bits): 
Adresse: 

[Adresse des aktuellen Zyklus ~"j 
Daten: 



40 



| Adresse des nachsten Zyklus 



CONTROL- Signale 



Es bleibt zu erwahnen, dass die Eingangsdaten typischerweise nicht verwendet 
werden, d.h. auf den Speicher wird nur lesend, nicht schreibend zugegriffen. 
Der Inhalt des Speichers (z.B. RAM-PAE) wird durch eine Konfigurationseinheit 
vorkonfiguriert. Deshalb kann der Speicher insbesondere auch als 
45 nichtf lQchtiger einmal programmierbarer Speicher mit ROM, EPROM, EEPROM, 
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Flash Zellen oder basierend auf Fuse oder Antifuse Technologien aufgebaut 
sein . Der Spieicher wird .dann; wie vofab bereits beschrieben, vor der 
Auslieferung an den Kunden oder beira Kunden personalisiert, d.h. 
programmiert . .. . 

5 

Ein Speicherzugriff durch andere PAEs ist grundsatzlich moglich, urn den 
Sequenzer z.B. im Betrieb zu modif izieren, soli aber aufgrund des begrenzten 
Einsatzbereichs hier nicht welter detailliert ausgefuhrt werden. 

10 Der erf indungsgema fie Sequenzer kann durch folgende Erweiterungen in seiner 

Abf olge von Zyklen auf Ereignisse reagieren und insbesondere bedingte Sprtinge 
durchfuhren: 

Bin Teil, bevorzugt der niederwertige, der Eingangsadressen zu dem Speicher 
wird als Eingang fur.weitere Zustandssignale verwendet. Diese Zustandssignale 

15 konnen durch die yorstehenden fiber tragungsar ten ubertragen werden und somit 
Daten oder Trigger sein. Bei der Selektion des nachfolgenden Zyklus wird 
nunmehr eine mogliche Menge von Zyklen durch die Daten ruckkopplung auf die 
bevorzugt hohen Adressbits bestimmt und der bestimmte Zyklus wird dann aus 
der mfiglichen Menge durch die Zustandssignale auf den niederen Adressbits 

20 selektiert. 

Daraus resultiert folgender Aufbau der Eingangsadressen, bzw. Ausgangsdaten 
wie folgt (Darstellung : hoherwertige Bits ... niederwertig Bits); 
Adresse : 

Zustandssignale 



25 



Adresse des 
aktuellen Zyklus 



Daten: 

Adresse des nachsten Zyklus ~~ ~~ I CONTROL- Signal e 



30 



somit ist ein vollwertiger Sequenzer def iniert, der den Grundprinzipien der 
Mealy-Moore Sequenzern en tspricht. 



Die Zustandssignale und/ oder Control-Signale konnen nunmehr ggf . zu Bundeln 
zusammengefafit der art gruppiert werden, dass je eine Gruppe bestimmt en 
Sendem/Empfangern zur Verfugung stent, z.B. eine Gruppe fur 0101-interne 
PAEs und eine Gruppe fur externe Baugruppen und eine Gruppe zur 
35 Konfigurationseinheit. 



Mit anderen Worten werden samtliche Sprunge durch die Angabe der •Adresse des 
nachsten Zyklus* realisiert. Bedingungen werden durch die Zustandssignale 
realisiert. 

Das dabei auftretende Problem ist, wie sog. don % t cares, also bestimmte 
Zustandssignale, der en Wert zu einem zyklus bedeutungslos ist, behandelt 
werden. Die bevorzugte Variante liegt darin, fur samtliche moglichen Werte 
dieselben Daten festzulegen. 
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Beispiel : 



10 



Innerhalb einer f olgendennassen aufgebauten Adresse 
Adresse des ~~ 



aktuellen Zyklus 



Zustandssignale 



soli die 'Adresse des aktuellen Zyklus - (Cycle) beispielhaft gleich 0x60, 
entsprechend CYCLES 0 sein. Es sind 4 Zustandssignale (ZS0..3) vorgesehen, von 
denen innerhalb des beispielhaf te Zyklus' 2 (ZS3 und ZS1) 3e nach Wert zu 
anderen Sprungzielen ftihren, also beispielhaft nach CYCLE10, CYCLE7, CYCLES 9, 
CYCLE56 

Die Tabelle sieht nunmehr wie folgt aus: 



Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZS1 


zso 




CYCLE60 


0 


0 


0 


? 


CYCLE10 


CYCLES 0 


0 


? 


1 


? 


CYCLB7 


CYCLE60 


1 


? 


0 


•p 


CYCLES 9 


CYCLE 60 


1 


? 


1 


? 


CYCLE 5 6 



Die don't cares (ZS2, ZSO) werden nunmehr so belegt, dass der Wert ihres 
Signales keinen EinfluS auf die Zuordnung der Adresse zu den Daten hat: 



Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZS1 


zso 




CYCLES 0 


0 


0 


0 


0 


CYCLE10 


CYCLE60 


0 


0 


0 


1 


CYCLE10 


CYCLES 0 


0 


0 


1 


0 


CYCLE7 


CYCLE60 


0 


0 


1 


1 


CYCLE7 


CYCLES 0 


1 


0 


0 


0 


CYCLE89 


CYCLES 0 


1 


0 


0 


1 


CYCLE 8 9 


CYCLES 0 


1 . 


0 


1 - 


0 


CYCLE56 


CYCLES 0 


1 


0 


1 


1 


CYCLES 6 


CYCLES 0 


0 


1 


0 


0 


CYCLE10 


CYCLES0 


0 


1 


0 


1 


CYCLE10 


CYCLES 0 


0 


1 


1 


0 


CYCLE7 


CYCLES 0 


0 


1 


1 


1 


CYCLE7 


CYCLES0 


1 


1 


0 


0 


CYCLES 9 


CYCLES 0 


1 


1 


0 


1 


CYCLE89 


CYCLES 0 


1 


1 


1 


0 


CYCLES S 


CYCLES 0 


1 


1 


1 


1 


CYCLES S 



15 

Jeder Zielzyklus ist nunmehr 4-fach gespeichert, entsprechend alien binaren 
KombinationsmOglichkeiten der don't care. 

Eine weitere optionale, aber sinnvolle und daher bevorzugte 
20 Ausaestaltungsmttglichkeit des Sequenzers sieht einen zusatzlichen Teilbereich 
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der Ausgangsdaten fur eine Selektor- und/oder Vergleichsmaske ftir die 
Zustandssignale vox. Bei der Verwendung als Selektor kdnnen z.B. durch die 
Ansteuerung von Multiplexera durch die Selektormaske eine Teilmenge von 
Zustands signal en aus mehreren mdglichen ausgewahlt werden . Die zusatzliche 

5 optionale Vergleichsmaske kann als Vergleichsoperator fOr einen Vergleicher 
dienen, der entsprechend ein Statusbit (gleich/nicht gleich) aus einer Menge 
von Statusbits generiert. Ebenfalls kann die Vergleichsmaske zur Deselektion 
von don't care Signal en dienen, z.B. ttber eine normale Maskenoperation durch 
Verundung nach ,dem Stand der Technik (siehe PACT10) . 

.0 ...... 

Der Aufbau der Ausgabedaten ist dann wie folgt: 



Da ten: 



Adresse des nSchsten 


GONTROL-Signale 


Selektor /Vergl eichsmaske 


Zyklus 







15 

Ein bevorzugter Sequenzer kann beispielsweise wie folgt aufgebaut sein: 
Der Adressbus einer RAM-PAE, die als Sequenzer speicher verwendet wird, wird 
in raehrere Teiladressen beliebiger und insbesondere rooglicherweise auch 
unterschiedlicher Breite aufgeteilt, beispielsweise Bit 0. .3 fur eine erste 
20 Teiladresse (NEXT_CYCLE) , Bit 4.. 7 fur eine zweite Teiladresse (SEQL.IN) und 
Bit 8.. 12 fur eine dritte Teiladresse (CTRLJEN) . 

Der Datenausgang einer RAM-PAE wird in mehrere Teildaten beliebiger und 
insbesondere m&glicherweise auch unterschiedlicher Breite aufgeteilt, 
beispielsweise Bit 0..3 fttr die ersten Teildaten (CYLCE) , Bit 4.. 7 fur die 
25 zweiten Teildaten (SEQL.OOT) und Bit 8.. 12 ftir die dritten Teildaten 
(CTRL_OUT) . 

Zur Auf teilung der Adressen und/oder Daten kann insbesondere das beschriebene 
SIMD PAE- und Bus-Konzept verwendet werden. Weiterhin kann die Auftrennung 
30 innerhalb der RAM-PAE erfolgen. 

Der RAM-PAE kOnnen datenverarbeitende PAEs zugeordnet werden, wie z. B. ALU- 
PAEs. 

35 Die Pestlegung des nachsten Zyklusses innerhalb eines Sequenzerdurchlaufs 
erfolgt durch die ROckkopplung von NEXT_CYCLB auf CYCLE. 

In einer erweiterten Ausftthrungsvariante kOnnen zusatzliche 
datenver arbei tende PAEs zur Berechnung von CYCLE in Abhangigkeit von 
40 NEXT_CYCLE innerhalb der Ruckkopplung vorgesehen sein. Diese PAEs kttnnen auf. 
beliebige, insbesondere auch zusatzliche signale, Daten oder Zustande 
anderer PAEs und/oder extemer/ peripherer Baugruppen reagieren. Desweiteren 
kdnnen diese PAEs zusatzliche Signale oder Daten erzeugen. 
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Zur Realisierung eines erweiterten Seguenzers kanrien weitere PAEs angekoppelt 
sein, die in einer nioglichen Ausgestaltung auch.in ihrer Funktion und/oder 
Vernetzung yom Sequenzer beeinflu&t werden kOnnen. Dazu kann der Sequenzer 
Daten in die Konf igurationsregister der entsprechenden PAEs ttbertragen. Ein 
5 Zugriff auf die Konfigurationsregister kann beispielsweise durch die in DE 
197 04 728.9 beschriebene Architektur erfolgen (vgl. DE 197 04 728.9, Fig. 
4) . Die angekoppelten PAEs verarbeiten vorwiegend Daten beliebiger Art und 
besitzen Anschlufi an weitere PAEs, insbesondere datenverarbeitende (ALU- PAEs) 
und/ oder Speicber-PAEs {RAM- PAEs) und/ Oder periphere Anschluss e (IO- PAEs) . 
10 Diese PAEs konnen durch die durch SEQ_OOT darges tell ten Control- Signal e 
angesteuert werden und kann en bedarfsweise durch die an SEQUIN geleiteten 
Zus tands signal e Ablauf speicher des Sequenzers ansteuern. 

15 Weitere inOgiicherweise auch unabhangige PAEs oder Einheiten, insbesondere 

auch externe /periphere Einheiten und /oder ttbergeordnete CTs kSnnen durch den 
Sequenzerspeicher entsprechend SEQ_IN/0OT angesteuert werden (CTRL_0UT) oder 
dies en ansteuern (CTRL_XN) . 

20 

Zur korrekten taktgesteuerten Ablauf steuerung des Sequenzers sind in 
RQckkopplungspfade bevorzugt taktsynchronisierte Register eingebaut. 

Die RAM-PAE kann durch eine ttbergeordnete Konf igurationseinheit konfiguriert 
25 werden, insbesondere kSnnen die Sequenzer funktionen durch den Inhalt der RAM- 
PAE konfiguriert und festgelegt werden. 

Es wurde als vorteilhaf t erkannt und wird fttr sich als patentfahig gehalten, 
dass mit einem Speicher ein einfacher Sequenzer ohne grofien zus&tzlichen 

30 Hardwareaufwand realisiert wird* Dies ist besonders leicht dadurch mSglich, 
dass zunachst der Inhalt einer Speicherzelle dahingehend ausgewertet wird, an 
. welcher Stelle als nachstes ein Lesezugriff erfolgen soli, wenn dort wieder 
angegeben ist; wo als nachstes ein Zugriff erfolgt, ist ein automatenartiges 
Durchlaufen realisierbar. Zugleich wird aber gemafi der hier als vorteilhaf t 

35 er kann ten Ausgestaltung nicht einfach eine weitere Adresse fur den nachsten 
Zugriff ermittelt, sondem parallel dazu angegeben, was dabei zn tun ist; mit 
anderen Worten werden an der Speicheradresse auch Daten oder Bef ehle 
mitabgespeichert. Dies kann dadurch geschehen, dass ein Teil der an einer 
Stelle gespeicherten Information die Adresse fttr den nachsten Zugriff angibt 

40 und ein weitere Teil einen Befehl oder Daten darstellt. Dies ist ohne 

wei teres moglich, wenn die Breite der gespeicherten Daten auf ge teil t wird in 
einen Adressanteil und einen Daten/Bef ehlsanteil . Weiter ist es sogar 
moglich, nur einen Teil der im Speicher adressierbaren Speicherpiatze zu 
kodieren, etwa bei 12 bit Breite nur 8 bit zu verwenden. Dann konnen weitere 

45 Bits hinzugefttgt werden, hier vier, etwa durch Auswertung von Flags, 

Triggem, Zustanden, tfberiaufen etc. Dies hat den Vorteil, dass an die 
Speicherstellen, die dann exakt angesprochen werden durch Vorgabe der hier 
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Sbitigen ausgelesenen Actress e und der hier 4bit auswertegenerierten 
Information, unterschiedliche Anweieungen gesetzt werden kflnnen. Es sei 
darauf hingewi esen, dass entweder alle Trigger und die erf orderliche Reaktion 
hierauf von vorheherein festlegbar sind oder dass alternativ auch zumindest 
5 Teile der Reaktionen auf einzelne oder alle Trigger wahrend der AusfOhrung 
einer Konf iguration variiert und /oder festgelegt werden kOnnen. Hierzu kann 
eine Rtlcfckopplung auf eine Triggermaskierung usw. vorgesehen sein. 

Dies erlaubt es, abhangig von den ausgewerteten Information en bedingte 
10 Sprttnge etc. zu generieren. Sind dabei von einer Reihe per- se auswertbarer 
Informationen nur wenige interessant, warden also aktuell im obigen Beispiel 
etwa nur 2 statt vier Bits bentttigt, so kann die jeweils in einer 
entsprechenden Speichers telle angegebene Information an jenen Speichers tell en 
auch vorhariden sein, die sich nur urn nicht interessierende Bits in ihrer 
15 Adresse unterscheiden . 

Figur 15 zeigt ein Ausgestaltungsbeispiel eines erf indungsgemcUBen Sequenzers 
basierend auf einer RAM-PAB. Ein Teil (1505) des Datenausgangs (1502) eines 
Speichers (1501) ist Ober ein taktgesteuertes Register (1503) auf den 
20 Adresseingang (1504) des Speichers zurOckgekoppelt. Der Adresseingang (1504) 
entspricht somit CYCLE una 1505 einem Teil, bevorzugt dem HSherwertigen, von 
NEXT_CYCLE . 

Optional kann ein Teil (1508) des Datenausgangs (1502) an eine Selektor- 
25 Maskeneinheit (1509, 1510) gefOhrt werden, in welcher die vom Bus system 0105 
als Daten und/ oder Trigger eingehenden SEQUIN (1511) bzw. CTRLJN (1512) 
Da ten verarbeitet werden. 

CTRL_IN und SEQ_IN und/ oder der en in der Selektor-Maskeneinheit verarbeitete 
30 Werte werden zu 1505 dazugemischt (1513), bevorzugt derart, dass 1505 den 
httherwertigen Adressteil und CTRL_IN/SEQ_IN den niederwertigen bilden. 

Der verbleibende Teil des Datenausgangs (1502) kann in einen SEQlOUT- (1506) 
und CTRL_OUT (1507) Teil aufgetrennt werden und uber die Ausgabebaugruppen 
35 0803a, b als Daten und/oder Trigger auf das Bussystem 0105 gefuhrt. 

Verschiedene Konf igurationsregietermodelle zur Festlegung der Konf iguration 
von jeweils lokal zugeordneten PAEs sind bekannt. In PACT02 ist ein 
sequentiell abarbeitbares Modell beschrieben, in PACT 04 ist ein FIFO-Modell 
40 beschrieben, das eben falls sequentiell abgearbeitet und Uber 1 append 

konfiguriert werden kann, in PACT08 ist ein selektives Modell beschrieben, 
bei welchem abhangig von der Datenverarbei tung bestimmte 

Konfigurationsregister und damit die in ihnen gespei chert e Funktion und/oder 
Vernetzung ausgewahlt werden. In DE 100 28 397.7 ist weiterhin ein FIFO- 
45 Modell beschrieben, das sich besonders fur die Vorabkonf iguration und 
tiberlappende Konf iguration eignet. 
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Als besonders leistungsfahig und Kosten/Performance effizient wurde eine 
Mischiing aus diesen Model! en erkannt. 

Das FIFO-Modell nach DE 100 28 397.7 eigne t sich besonders/ urn eine 
5 beliebige Anzahl von Konf igurationsregistern von PAEs vorzuladen, da die 
Function des verwendeten FIFOs eine variable KonfigurationBiange effizient 
ennaglicht. Hierzu wird jeder PAB ein lokaler FIFO-Speicher zugeordnet, der 
die Konf igurationen seiner zugeordneten PAE verwaltet und puffert. 

10 Durch eine Erweiterung, wie z. B. die nachfolgend beschriebene, des FIFO- 
Model les kann der Anfang und das Ende einer bestimmten . Konf iguration und der 
dazugehorenden einzelnen Konf igurationseintrage festgestellt werden. Nunmehr 
kdnnen mehrere Konf igurationen zugleich in dem FIFO-Modell abgelegt werden . 

15 Als besonders geeignet zur Kenhzeichnung des Anf angs oder Endes von 

Konf igurationen haben sich die zwei nachfolgend beschriebenen Verfahren 
her aus ges tell t : 

a) Kennzeichnung durch zusatzliche Bits (CycleBits) in jeder Speicherzelle: 
20 Jedem Konfigurationseintrag werden zusatzliche Bits zugeordnet, die den 
Beginn und/oder das Ende einer Konf iguration kennzeichnen. Beispielsweise 
kann ein Eintrag im FIFO wie folgt aussehen: 



Bit 0..15 


Bit 16 


Bit 17 


Konf igurationswor t 


0=don't 

care 

l=Beginn 


0=don't 

care 

l=Ende 


Da bevorzugt nach dem nachfolgend beschriebenen Verfahren direkt auf den 
Beginn von Konf igurationen gezeigt werden kann, wird bevorzugt auf die 
Anzeige des Beginns verzichtet: 


Bit 0..15 


Bit 16 




Konf igurationswor t 


0=don' t 

care 

l=Ende 





b) Besonders effizient kann die Kennzeichnung durch besondere 
Konfigurationsworte sein, die als Befehle dekodiert werden: 
30 Bestimmte Bitkombinationen innerhalb des Konfigurationswortes werden als 
Befehle dekodiert und erkannt: 

Beispielsweise kOnnten die folgenden Befehle implement iert sein: 
BEGIN : Beginn einer Konf iguration 
END : Ende einer Konf iguration 
35 Dieses Verfahren 1st erheblich flexibler und leistungsfahiger als die 
Kennzeichnung durch CycleBits. 
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Zur einf achen Unterscheidung von Befehlen und Konfigurationen kann ahnlich 
den CycleBits ein Bit vorgesehen sein, das durch seihen Wert die Semantik der 



Konfigurationswortes bestimmt, beispielsweise wie folgt: 



Bit 0..15 


Bit 16 


Daten 


O=lnterpretation der Daten als 




Konfigurationswort 




l=Interpretation der Daten als 




Befehl 



5 Eine Konfiguration wird je Aufruf von ihrera Anfang bis zu ihrem Ende in die 
Konfigurationsregister einer PAE ttbertragen. 

Durch eine optional e zusatziiche tibersetzungs- und Zuweisungsvorrichtung 
kcnnen Zustahde (z.B. Zustande der eigenen ALU und/oder ein oder mehrere 
10 Trigger (vgl. DE 197 04 728.9 ) beispielsweise anderer PAEs) auf bestimmte 
Konfigurationen innerhalb des PIFO-Modells tibersetzt werden. Beispielsweise 
kann ein eintref fender Rekonfigurations trigger auf eine bestimmte 
Konfiguration innerhalb des FIFO-Model 1 s zeigen, die durch das Auftreten des 
Rekonfigurations trigger dann konfiguriert wird. 

15 

Als Obersetzungs- und Zuweisungsvorrichtung konnen beispielsweise 
algebraische Berechnungen und/oder logische Verknupfungen und/oder bevorzugt 
Obersetzungsspeicher (Lookup-Tabellen) zum Einsatz kommen. 

20 Wenn verschiedene Konfigurationen in einer oder fur eine Oder eine Reibe von 
PAEs abgelegt werden, so bietet es sich an, die Adressen, an denen die 
jeweilige Information abgelegt ist, auf einf ache Weise dadurch zu verwalten, 
dass die Langen der jeweiligen abgespeicherten Konfigurationen aufaddiert 
werden. Dies ist dann wichtig, wenn die Konfigurationen unterschiedliche 

25 Langen haben, etwa well bei bestimmten Konfigurationen Busse und/oder 

Register, wie Vorwarts- und Rtlckwartsregister konfiguriert werden rati s sen und 
bei andere nur neue FunJctionen der ALU einer PAE einzustellen sind, oder well 
gleichzeitig Konf igurations information fur zellexterne Einheiten mitverwaltet 
wird. 

30 

Es ist damit also moglich, einen Quasi -Fifocharakter zu implementieren. Dann 
sollten Mittel zum Aufaddieren, insbesondere sukzessivem Aufaddieren von 
Konfigurationslangen, sowie dafur, bei ttberf lussigwerden bestimmter 
Konfigurationen, etwa aufgrund von Abarbeitung etc., die betreffenden 
35 Bereiche freizugeben. Das Aufaddieren ist etwa problemfrei mit Addiererketten 
moglich. 

Diese Anordnung kann verwendet werden, um in einer Zelle Konfigurationen zu 
verwalten bzw. wiederum einen Sequenzer zu implementieren. Wiederum kann so 
40 auf die Konfigurationen reagiert werden, dass sich Sprtinge etc realisieren 
lassen. Es sei darauf hingewiesen, dass oben bereits erwahnt wurde, dass zur 
Realisierung von Sequenzern zwischen ALU- PAEs und/oder anderen 
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datenverarbeitenden Zellen mit jeweils gegebenenfalls erweiterter 
Funktionalitat und Speicherzellen Steuer (Command-) Lei tungen vorgesehen werden 
konnen. Es. sei erwahnt, dass derartige Leitungen mit zugeordeten Steuerungen 
auch inner halb einer einzelnen und fur sich autark seqeunzerfahigen PAE 
5 vorgesehen sein konnen. 

Eine besonders bevorzugte Variante ist in Figur 14 dargestellt und arbeitet 
wie folgt: 

10 Eine Kette von Addierern wird derart . ndteinander verbunden, dass das Ergebnis 
(SUMMB) eines vorherigen Addierers (p) an einen nachfolgenden Addi erer (p+1) 
als Operand weitergeleitet wird. Die Weiterleitung kann derart unterbrochen 
werden, dass anstatt des Ergebnisses eine 0 (Null) weitergeleitet wird. 
Als zweiter Operand ist jedem Addi efer jeweils ein eigenes Registers 

15 zugeordnet, des sen Wert jeweils zur SUMME der vorherigen Stufen addiert wird. 
Jede der Stufen reprasentiert eine Konf iguration im Konfigurations-PIFO; in 
dem Register der jeweiligen Stufe ist die relative Startposition einer 
Konf iguration gespeichert. Die absolute Startposition lafct sich nun 
berechnen, indem samtliche relative Startpositionen der sich unterhalb im 

20 FIFO befindenden Konf igurationen auf addiert werden. Dies geschieht durch die 
Addi ererket ten, wie auch aus der Fig. Ersichtlich ist. 

Mit anderen Worten ist die relative Position als unterste Konf iguration im 
FIFO diejenige, deren Eintrag am Nachsten zum Ergebnis ausgang der 
25 Addiererkette gespeichert ist. Sodann folgen alle weiteren relativen 
Positionen gemaS ihrer Anordnung im FIFO. 

Die Kette wird an der Stelle durch einschleusen einer Null anstelle der SUMME 
unterbrochen, bei welcher die relative Position der selektierten 
30 Konf iguration erreicht ist. 

Das Ergebnis ist nunmehr der Offset zwischen dem Lesepointer des FIFOs, der 
auf die unterste Konf iguration zeigt, und der Startposition der selektierten 
Konf iguration . 

Somit ist die Sprungadresse zur selektierten Konf iguration einf ach durch 
35 Addition von Zeiger und Offset berechenbar. 

Die Auswahl der selektierten Konf iguration kann durch unterschiedliche 
Verfahren in der ttbersetzungs- und Zuweisungseinrichtung erfolgen. 
(a) Die eingehenden Trigger kOnnen priorisiert und dekodiert werden. 
40 (b) Die eingehenden Trigger werden tiber eine Lookup -Tabelle Obersetzt und 
danach mOglicherweise priorisiert und dekodiert. 

(c) Es der Menge aller Trigger werden einige ausgewahlt, z.B. tiber 
Multiplexer, die sodann entsprechend (a,b) weiterverarbeitet werden. 

45 Es soli besonders darauf hingewiesen werden, dass ein Trigger auch ein Vektor 
(TRIG-V) sein kann, wie in PACT08 beschrieben. Der Vektor selbst kann zur 
weiteren Dekodierung verwendet werden, d.h. der Vektor selektiert die 
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Konfiguration. Dies ist insbesondere dann wichtig, wenn eine Wave- 
Rekonfiguration nach PACT08, PACT13, PACT! 7 " durchgef uhrt werden soli, bei 
welcher bevorzugt ein mit den Da ten tlbertragener Trigger-Vektor die nSchste 
Konfiguration selektiert. 

5 

Nach oder wahrend der Konfiguration kGnnen Konf igurationen aus dem FIFO 
entfemt werden. Bevorzugt wird dabei die Referenzierung innerhalb der 
fibers etzungs-. und Zuweisungsvorrichtung entsprechend angepasst. 

10 * . 

Weiterhin kann das FIFO-Mod ell urn das Sequenz er-Ver f ahren nach DE 196 54 
846.2-53 (bzw, wie bei den anderen Schutzrechten, ohne separat erwahnt zu 
sein, deren parallele) oder bevorzugt das vorstehend beschriebene erweitert 
werden. Dazu werden beispielsweise Sprunge (GOTO) , sowie zustandsabhfingige 

15 und bedirigte Sprunge (WAIT-GOTO, IF-GOTO) eingefuhrt. Sprunge konnen durch 
besondere CycleBits reprasentiert werden, oder bevorzugt als Befehle 
implementiert sein. 

Weiterhin kann ein Synchronisations anzeigeverfahr en verwendet werden, das 
20 anzeigt, wann eine bestimmte Konfiguration bzw. ein bestimmter Zyklus des 
Sequenzers beendet ist. Mit anderen Worten kann jeder Zyklus aus mehreren 
Konf igurations ein tr&gen bestehen. Zur Kennzeichnung kann beispielsweise nach 
DE 196 54 846.2-53 ein run/stop-Flag verwendet werden, wobei 'run 1 
zueannnengehdrende KonfigurationseintrSge eines Zyklus kennzeichnet und •stop 1 
25 den ersten Eintrag eines nachfolgenden Zyklus; alternativ ist ist die 

Verwendung der vorstehend beschriebenen CycleBits moglich, die zwar eine 
etwas andere Semantik aufweisen, sich aber ansonst gleich vernal ten. 

Alternativ Oder zusatzlich zu dies en Verfahren kGnnen auch die ebenfalls aus 
30 den fruheren Anmeldungen des Anmelders bekannten Befehle WAIT und BEGIN oder 
bevorzugt die vorstehend beschriebenen Befehle BEGIN und END verwendet 
werden. 

Durch >stop' oder WAIT oder END wird das Ende eines Zyklus. gekennzeichnet, d. 
h. eine Konfiguration ist komplett, kann ausgefuhrt und abgearbeitet werden. 
35 Nach Beendigung der Datenverarbeitung dieser Konfiguration wird der nachste 
Zyklus ausgefuhrt. 

Die Beendigung kann entsprechend sequentieller Prozessoren durch ein en Takt 
(Instruktionssequenzing) definiert sein, und/ oder entsprechend des 
40 Datenverarbeitungsprinzips der PACT-Prozessoren (P 44 16 881.0-53 , DE 196 54 
846.2-53 , Konfigurationsseguenzing) durch ein Statussignal (z. B. einen 
Trigger) definiert sein. 

Mit anderen Worten wird z.B. kann durch das Eintreffen eines Triggers 'stop 1 
45 ubersprungen werden und die nachfolgenden Konf igurationen konf iguriert 

werden. Alternativ oder zusatzlich kann der Befehl WAIT eingesetzt werden, 
der auf das Eintreffen eines Triggers. 
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Optional kann ein FIFO nlcht nur die lokal zugeordnete PAE ansteuern, sondem 
auch weitere,. insbesondere umliegende oder zur. selben .Konfiguration gehc-rende 
PAEs! 

5 

Optional kann der FIFO auch als eine dedizierte Einheit nach DE 196 54 846.2- 
53 ausgestaltet sein. 

Ausftthrungsbeispiele: 
10 A) Bin eintref fender Trigger wird ttber eine tibersetzungs- und 

Zuweisungsvorrichtimg auf eine im FIFO liegende Konfiguration (Kl) ubersetzt. 

Die Konfiguration (Kl) wird daraufhin in die PAB konfiguriert. Als Ende- 

Kennung kann bei spiel sweise ein WAIT-Befehl, ein END-Befehl oder das 

run/stop-Flag dienen. 
15 Bin nachfolgend eintref fender Trigger wird ttber eine Cbersetzungs- und 

Zuweisungsvorrichtung auf eine andere im FIFO liegende Konfiguration (K2) 

ubersetzt. Diese Konfiguration (K2) wird daraufhin in die PAE konfiguriert. 

Kl und/oder K2 kdnnen nach erfolgter Konfiguration in die PAE aus dem FIFO 

gelOscht werden. 

20 

B) Ein eintref fender Trigger wird ttber eine Obersetzungs- und 
Zuweisungsvorrichtung auf eine im FIFO liegende Konfiguration (K3) ubersetzt, 
die aus mehreren Zyklen (Cyl, Cy2, Cy3a, Cy3b, Cy4) besteht. Der erste Zyklus 
(Cyl) wird daraufhin in die PAE konf iguriert und ausgeftthrt. Als Ende-Kennung 

25 kann beispielsweise ein WAIT-Befehl oder das run/stop-Flag dienen. 

Ein nachfolgend eintref fender Trigger, der das Ausfuhrungsende des Zyklus 
anzeigt, bewirkt die Konfiguration und das Ausfuhren von Cy2. Cy2 endet mit 
zwei WAIT-QOTO-Befehlen (WAIT -GOTO (Trgl, Cy3a) ; WAIT-GOTO (Trg2, Cy3b) ) 
(vgl. PACT04), dies bewirkt, dass auf zwei unterschiedliche Trigger, die das 

30 Ausfuhrungsende des Zyklus anzeigen, Trgl und Trg2 reagiert wird. Trifft Trgl 
ein, wird im nachsten Zyklus Cy3a konfiguriert und ausgeftthrt bzw. bei Trg2 
entsprechehd Cy3b. 

Cy3a und Cy3b enden mit einem WAIT-GOTO (Trg, Cy4) . Bei eintref fen eines 
35 Trigger, der das Ausfuhrungsende des Zyklus anzeigt, wird nach Cy4 gesprungen 
und die Konfiguration entsprechend konfiguriert und ausgeftthrt. 

Cy4 endet mit einem WAIT-GOTO (Trg, CyD* wodurch bei eintref fen des Trigger, 
der das Ausfuhrungsende des Zyklus anzeigt, der erneute sequentielle 
40 Durchlauf einer Schleife beginnen kann. Insoweit kann durch den Sprung auf 
Cyl ein Ringspeicher nach DE 196 54 846.2-53 zum Ausfuhren von Schleifen 
gebildet werden, wobei solch ein Ringspeicher vorteilhaft, aber nicht 
zwingend ist. 



45 Durch Eintreffen eines Triggers (Trg-x> kann die Schleife termini ert werden. 
Existiert ein Eintrag fur Trg-x in der ubersetzungs- und 

Zuweisungsvorrichtung kann die Schleife jederzeit abgebrochen und die durch 
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Trg-x in der Obersetzungs- und Zuweisungsvorrichtung referenzierte 
Konfiguration (K3C) ausgefOhrt werden. 

Existiert kein Eintrag, kann durch das explizite Verwenden von WAIT-GOTO 
(Trg-x, KX) Befehlen, 1 z.B. zusammen mit WAIT-GOTO (Trg, cyl) in Cy4 die 
5 Schleife zu bestimmte vorgegebenen Ausfllhrungszeitpunkten termini ert werden. 

Figur 13 zeigt beispielhaf t einen Aufbau eines Konfigurationsbusses zur 
Konfiguration von PAEs (1001) durch eine Konfigurationseinheit (0106). Die 
Konfigurationseinheit sendet Konfigurationsdaten ttber ein Bus system 1301 und 

10 ggf. Qber roehrere Registers tuf en (1303, 1304) zur Verbesserung des 

Frequenzverhal tens und tiber den Konf igurationsdatenbus (0404) an die PAEs 
1001. Jede PAE dekodiert die angelegten Adressen und reagiert, sofem sie 
selektiert wurde, auf die Datenubertragung des Busses. PAEs kcnnen ihrerseits 
Da ten aber 0404 Qber die Register-Multiplexer-Stuf en 1304 auf das Bussystem 

15 aufschalten und die Konfigurationseinheit oder optional andere PAEs senden. 
Dies geschieht jeweils durch Obertragung der Adresse der Empfangseinheit. 
Die Rttckttbertragung der Daten an die Konfigurationseinheit erfolgt bevorzugt 
ebenfalls durch Registerstuf en hindurch (1305), bis zum Dateneingangsbus der 
Konfigurationseinheit (1302) . 

20 Die Funktionsweise des Konfigurationsbusses 1st ebenfalls in DE 101 42 904.5 
und DE 100 28 397.7 beschrieben, die zu Of fenbarungszwecken vollumf anglich 
eingegliedert sind. 

Figur 14 zeigt den Aufbau eines erf indungsgemaSen FIFO-Model Is zur Steuerung 
25 der Rekonf iguration; hierbei wird darauf hingewiesen, dass sich insbesondere 
durch die Befahigung zur Durchftihrung von Sprttngen das hier prasentierte 
Fifo-Modell von reinen Fifos aus dem Stand der Technik unterscheiden kann. Es 
wurde dennoch die per se im Stand der Technik belegte Bezeichnung verwendet, 
well diese vom typischen, sprungfreien Betrieb ein besonders ahschauliches 
30 Bild assoziieren lafit. Diese Einheit ist optional zu alien, insbesondere den 
in dieser Anmeldungen beschriebenen, rekonf iguierbaren Zellen (PAEs) und in 
Figur 4 als Einheit 0406 darges tell t. V 

Ein Speicher 1401 enthalt die Konfigurationsdaten ftir die zugeordnete PAE. 
1402 ist der Konfigurationsdatenausgang zu den Konf igurationsregi stern der 

35 PAE (0405) . Ober 1403, d.h. den Bus 0404, schreibt die Konfigurationseinheit 
Konfigurationen in den Speicher, die jeweilige Adresse wird durch den 
Schreibzeiger (1407) generiert, der pro Schreibvorgang um den Wert 1 
verandert wird, je nach Arbeitsweise des FIFOs inkrementell oder 
dekrementell . Ein S tar tadress -Pointer (1404) zeigt auf den ersten 

40 Konfigurationsdateneintrag im Speicher, wahrend ein weiterer Pointer (1405) 
auf den zu lesenden, bzw. an die PAE zu Ubertragenden, 

Konfigurationsdateneintrag zeigt. 1405 wird mit jeder Datenubertragung aus 
dem Speicher an die PAE um den Wert 1 verandert, je nach Arbeitsweise des 
FIFOs inkrementell oder dekrementell. Die DatenQbertragung findet so lange 
45 statt, bis das Ende der Konfiguration von einer 

Konfigurationsendeerkennungseinheit (1409) erkannt wird, beispielsweise 
anhand eines CycleBits oder Bef ehls (WAIT, END) . 
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per realisierte FIFO entspricht nicht den normalen FIFOs nach dem Stand der 
Technik, die nur den -Pointer 1405 aufweisen. Die Modifikation ermfiglicht das 
Lesen beliebiger Konf igurationsdaten aus dem Speicher, wahrend durch den 
Pointer 1404 verhindert wird, dass evtl. noch benOtigte Konf igurationsdaten 
5 uberschrieben werden. Dies geschieht durch das Erzeugen eines Full-Flags 
durch den Vergleich (1406) des S tar tadr ess-Pointers 1404 rait dem 
Schreibzeiger (1407) . Wenn der Speicher voll ist, werden Schreibversuche der 
Konf igur at ions einheit zuruckgewiesen, dies kann bevorzugt durch das aus 
PACT10 bekannte ACK/REJ-Protokoll erfolgen. Der Vergleicher 1406gibt dazu an. 
10 seinem Ausgang 1416 ein entsprechendes Reject-Signal an die 
Konfigurationseinheit aus bzw. gibt kein Ack aus. 

Ein beispielhafter Speicherinhalt von 1401 ist mi t 1408 gezeigt. Der Speicher 
enthalt 5 Konf igur ationeh (C0..C4). 1404 zeigt als Startpointer auf die erste 
15 Konf iguration CO . In diesem Beispiel zeigt 1405 auf den Beginn von 

Konfiguration C3. Die Zeigerposition berechnet sich aus dem Wert von 1404 
plus der Lange der Konfiguration CO plus der Lange der Konfiguration CI plus 
der Lange der Konfiguration C2. 

20 Eingehende Trigger (1431) werden Ober eine in Figur 14a dargestellte 

tJbersetzungs- und Zuweisungseinrichtung (1432) auf Selekt-Signale (SC0..n, 
1433) ubersetzt, die die Adressierung der Konf igurationsdaten im Speicher 
steuern. Diese Obersetzungs- und Zuweisungseinrichtung kann fest vorgegeben 
ihre Zuweisung vornehmen, ist aber bevorzugt wahrend der Abarbeitung einer 

25 Konfiguration veranderlich, wozu geeignete Rllckkopplungen , Signal lei tungen 
etc. vorzusehen sind. Besonders wenn die tJbersetzungs- und 
Zuweisungseinrichtung veranderlich ist, wird es bevorzugt, auch und/oder 
zus&tzlich die der Zuordnung dienende Einheit 1434 wahrend der 
Datenverarbeitung veranderlich zu gestalten. Auch hierzu sind ehtsprechende 

30 Schaltungsanordnungen vorzusehen, wobei die Veranderung der Zuordnung 
insbesondere programmgesteuert ablaufen kann, Eine entsprechende, 
insbesondere programmgesteuerte Veranderung ist auch fur die Einheit 1414, 
d.h. das Adressberechnungsadditionskettenraittel moglich. Die diese 
Aktualisierung und/oder neue Verhaltensweisen ausl6senden Bef ehle werden 

35 bevorzugt in der Speichereinheit 1401 hierfttr abgelegt. 

Je ein Register (1411), ein Addierer (1412) und ein Nullgenerator (1413), 
hier beispielhaf t realisiert durch eine bitweise Und-Funktion, bilden ein 
Glied einer Kette (1414) zur Adressberechnung. Je ein Glied verwaltet den 

40 Offset einer Konfiguration. Die Aneinanderreihung der Glieder entspricht der 
Aneinanderreihung der Konfigurationen im Speicher 1401. Mit anderen worten 
wird entsprechend des Beispiels 1408 das erste Glied die Lange der 
Konfiguration CO aufweisen, also den Offset der auf 1404 addiert werden muss, 
um auf die Konfiguration CI zu zeigen. Das zweite Glied weist die Lange der 

45 Konfiguration CI auf, also den Offset der auf den Offset von CO und auf 1404 
addiert werden muss, um auf die Konfiguration C2 zu zeigen. Das dritte Glied 
weist die Lange der Konfiguration C2 auf, also den Offset der auf den Offset 
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von CO und auf den Offset von CI und auf 1404 addiert werden muss, um auf die 
konfiguration C3 zu zeigen. Und so weiter. 

Es wird anhand der Ausfdhxung ersichtlich, dass eine Kette von Additionen 

entsteht, deren Gliederanzahl der Position der Konfiguration im Speicher 
5 entspricht. Dies wird durch die Kette 1414 wie folgt realisiert: 

ttber den Addierer wir jeweils der im Register gespeicherte Wert, also die 
: Lange der jeweiligen Konfiguration, zu dem Ergebnis des vorherigen Gliedes 

dazuaddiert. Der Wert am Eingang der bitweisen Und-Punktion wird mit alien 

Ergebnisbits des Addierers verundet. 1st der Eingang also gleich 0, liefert 
10 die Und-Punktion eine Binare 0 am Ausgang, urn die Addiererkette bei der 

auszuwahlenden Konfiguration abzubrechen, ansonsten den Wert des 

Addierers ausgangs . 

Mit anderen Worten 1st in die Register (1411) die GrSfie der Konf igurationen 
15 in ihrer Reihenf olge im Speicher (1401) eingetragen. Die Selektsignale sind 
der art auf die Null -Genera tor en geftihrt, dass die Konfigurations-Gr6Sen bis 
zur Startadresse der durch die Trigger (1431) referenzierten Konfiguration 
auf addiert werden. - 

20 Somit addiert die Kette alle Langen von Konfigurationen, die vor der zu 

ladenden Konfiguration im Speicher 1401 liegen. Damit bildet sich ein Offset, 
der durch Addition (1415) mit der Startadresse (1404) auf die zu ladende 
Konfiguration zeigt. 

25 Die beschriebene Schaltung ist besonders leistungsfahig, da sie die 

Berechnung des Offsets und den Sprung innerhalb eines Taktes ermoglicht. 

In einer zweiten optionalen Kette (1421) k6nnen in Registern (1422) Befehle 
an die Kohf igurationseinheit und/oder die PAB und/oder den 

30 Konf igurationsstack gespeichert werden. Eine Null funktion (1423), hier 

ebenfalls beispielhaft entsprechend der Nullfunktion 1413 realisiert, liefert 
eine Binare 0 in an ihr em Ausgang, sofem das Selekt-Signal nicht aktiv ist, 
d.h. die Konfiguration nicht ausgewahlt wurde, ansonsten den Registerinhalt 
(1422), also den Befehl. Ober eine Oder-Kette (1424) werden alle Null- 

35 Funktionsausgange miteinander verodert, sodass der Befehl im Register 1422 
der aktuell selektierten Konfiguration am Ausgang (1425) der Kette anliegt. 

Der Befehl kann nunmehr zum Ldschen von Eintragen im Speicher (1401) dienen, 
d.h einer der moglichen Befehle kann sein, dass bestimmte gespeicherte 

40 Konfigurationen gelOscht werden sollen bzw. zum Oberschreiben freigegeben. 
Dies kann z.B. durch den Befehl FLUSH erfolgen, der den Startzeiger (1404) 
mit dem Iiesezeiger 1405 ladt und somit alle vor dieser Adresse liegenden 
Daten zum ^berschreiben freigibt. Dies ist insofern bevorzugt, als die so zu 
uberschreibenden Konfigurationen im fifoartigen Speicher i.d.R. alter sind 

45 und daher typisch uberschrieben werden kfinnen, wahrend die jungeren 

Konfigurationen, die of to tal s noch benOtigt werden, weiter oben im quasi 
fifoartigen Speicher liegen werden. Ein weiterer bevorzugt implementierter 
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Bef ehl ist, dass neue Konf igurationen geladen werden sollen; dies ist dann 
wichtig, wenn das Krforderais, eine bestiramte neue Konfiguration zu 
benotigen, mit einer zumindest nicht geringen Wahrscheinlichkeit vorhergesagt 
werden kann. Dieser Bef ehl kann an eine zentrale 

5 Konfigurationsverwaltungseinheit oder dergl. abgegeben werden; die 
Direktladung ist gleichfalls moglich, etwa bei Zuordnung von I/O- 
Moglichkeiten. Auch ist es bevorzugt, wenn sowohl der 
Konf igurationsanforderungsbef ehl als auch der Flush- bzw. 
Altkonfigurationspreisgabebefehl simultan ausftthrbar und/oder speicherbar 

10 sind. Es sei erwahnt, das s derartige Bef ehle wie Plush, Laden oder 

Flush/Laden auch in anderen Speicherbereichen bzw. -einheiten wie etwa 1401 
ablegbar sind und dafur nicht zwingend eine dedizierte Einheit wie 1421 
vorzuseheh ist. Diese Verwendung einer per se bereits vorhandenen Einheit 
kann hardwarema&Lg bevorzugt sein. 

15 

Weiterhin kann der Bef ehl ttber das Bus system nach Figur 13 an die 
Konf igurationseinheit gesendet werden (1426) . Beispielsweise kann der Befehl 
dort den Start einer bestimmten Konfiguration ausl 6s en und/oder das Vor laden 
einer Konfiguration bewirken. 

20 

FLUSH, also das Loschen von Konfigurationen ist einer der wesentlichen 
bevorzugten Bef ehle der Einheit. Einerseits ist der Befehl sehr vorteilhaft 
fur die Ausftlhrung, andererseits weist er das Problem auf, dass sich bei 
dessen Ausfuhrung samtliche Adressen und Referenzen verandem . 

25 Der FIFO wird "gef lushed* / indem der StartPointer (1404) auf eine neue 

Startadresse gesetzt wird. Diese wird wie in Fig. 14 dargestellt bevorzugt 
auf den Beginn einer gespelcherten Konfiguration gesetzt, wobei der Beginn 
durch die vorab beschriebene Berechnung mittels des Offsets bestiitrot wird. 
Alternativ oder zusatzlich kann der Zeiger auch auf einen bestimmten ahderen 

30 Wert z.B. eine an den FLUSH-Befehle gekoppelte Konstante gesetzt werden. 
Weiterhin mflssen die beiden Ketten 1414 und 1421 •geflushed" werden, damit 
die Adressberechnung der geanderten Positionen der Konf igurationen im 
Speicher 1401 entspricht. Dies geschieht jeweils durch (in Figur 14 nicht 
eingezeichnete) Multiplexer (1451), durch die die Registerdaten der art 

35 vorwartsubertragen werden, dass die nunmehr leer en ( "gef lushten* ) Glieder der 
Kette mit den Daten der nachf olgenden Glieder Qberschrieben werden, und zwar 
der art, dass a) die Reihenfolge der Daten in der Kette unverandert bleibt und 
b) das erste Glied der Kette mit neuen Daten belegt ist und c) alle weiteren 
Daten in ihrer Reihenfolge linear und ohne I#ticke in die Glieder nachf olgend 

40 dem Ersten geschrieben sind, vgl. hierzu Fig. 14a Es sei darauf hingewiesen, 
dass ttber die Multiplexer 1451 auch Daten betref fend die Konf igurationsgroBe 
von aufcen an die entsprechenden Stellen (Size of Config l..n) geschrieben 
werden kOnnen. Es ist dabei abzuschatzen, aber aus Grunden der 
Zeichnungsubersichtlichkeit nicht dargestellt, dass jede Stelle einzeln 

45 ansprechbar bzw. adressierbar ist. Verwiesen wird insoweit auf die in 1434 
dargestellte Einheit 1435, die diese Stelle jeweils bestimmt. 
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Durch die Verschiebung innerhalb der Ketten sind nunmehr die Selekt-Signale 
(SC0..n) an die neue Lage der Da ten in den Ketten anzupassen, damit wieder 
eine korrekte Zuordnung der Selekt-Signale zu der Of f setberechnung entsteht. 
Grundsatzlich stehen dazu mehrere Methoden zur Verftigung. Beispielsweise 
5 kdnnen 

a) Signale nach 1432 in 1434 binar kodiert (entsprechend der Funktion eines 
74LS148) werden, ein Offset, der der durch Plush entstandenen Verschiebung 
entspricht, wird subtrahiert und der entstandene Wert wird wieder dekodiert 
(entsprechend der Funktion eines 74LS139) um die Selekt-Signale 1433 zu 

10 generieren; 

b) Signale nach 1432 in 1434 mittels einer Lookup-Tabelle auf die Selekt- 
Signale 1433 ubersetzt werden. Dazu ist die Lookup-Tabelle der durch Flush 
veranderten Positionslage in den Ketten anzupassen. 

15 Eih besonders bevorzugtes Verf ahren fur die tibersetzung der Signale soil 
detailliert beschrieben werden und entspricht der in 1434 eingezeichneten 
Vorrichtung: 

Ein erstes Schieberegister (1435) en thai t als einen Ein-Bit-Wert die Position 
des aktuell ersten freien, also unbenutzten, Gliedes in den Ketten 1414, 

20 1421. Dies geschieht f olgendermaSen ; Nach einem Reset wird das 

niederwertigste Bit im Schieberegister auf 1 gesetzt (dargestellt durch einen 
gefullten Kreis) . Das niederwertigste Bit (Bit 0) wird auf das unterste Glied 
in den Ketten ref erenziert . Mit jedem Schreibzugriff auf die Ketten, also mit 
jedem neueri speichern (FILL) einer Konf iguration nach 1401 schiebt das 

25 Schieberegister das gesetzte Bit (PBIT) urn eine Position in Richtung des 

hechstwertigen Bits und ref erenziert damit auf das jeweils nachfolgende Glied 
in den Ketten. Das hochstwertige Bit ref erenziert somit auf das hOchste Glied 
in den Ketten, also ist das Schieberegister so breit wie Glieder in den 
Ketten vorhanden sind. Mit jedem FLUSH schiebt das Schieberegister das Bit 

30 (PBIT) um genau so viele Positionen wie Glieder in den Ketten gelOscht wurden 
in Richtung des niederwertigen Bits , 

Die tJbersetzungs- und Zuweisungseinrichtung (1432) ubersetzt bei der PAE vom 
Bussystera (0105a, Fig. 4) eingehende Triigger derart, dass je Trigger ein 

35 genau ein Signal des ausgehenden Busses (1437) gesetzt ist. Jedem Signal ist 
ein Schieberegister (1436) derselben Gr6Se wie 1435 zugeordnet. Es sind also 
eine Vielzahl von Schiebergi stern 1436 (vorliegend dargestellt 1436a. . .1436c) 
vorhanden, wobei deren Anzahl der Anzahl der maximal zulassigen 
unterschiedlichen Triggersignale entspricht und deren Lange d.h. Bitbreite 

40 der Anzahl der maximal zulassigen Konfigurationen entspricht, also der Anzahl 
der Kettenglieder entspricht. Beim neuen Speichern einer Konf iguration (FILL) 
wird der Inhalt von 1435 vor dem Verschieben von PBIT in das Scheiberegister 
(1436) geschrieben, auf das der, der Konf iguration zugeordnete, Trigger 
zeigt; dargestellt durch einen Kreis. 

45 Bei einem Auf treten des Triggers auf dem Bus liefert das entsprechende 

ubersetzte Signal (1437) einen 1-Wert, wahrend alle anderen Signale einen 0- 
Wert liefern. Die Signale 1437 werden jeweils an Nullgeneratoren (1438), 
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aufgebaut aus einer bitweisen Uhd-Punktion gefuhrt. Alle Nullgeneratoren 
deren Eitigarigs signal von 1437 einen O-Wert. aufweist, liefern einen Nullvektor 
am Ausgang. Der Nullgenerator, dessen Eingangs signal von 1437 einen 1-Wert 
aufweist, Obertrkgt den Inhalt des Schieberegisters 1436. Die Ausgange aller 
5 Nullgeneratoren werden miteinander verodert (143 a) , sodass die Selekt- Signal e 
SC0..n (1433) entstehen. 

Durch diese Funktion zeigt nunmehr ein eingehender Trigger uber die 
Nullfunktionen auf ein Schieberegister 1436, dessen gesetztes Bit wiederum 
10 auf ein Glied in der Ketten (1414,. 1421) zeigt. 

Bei einem Flush schieben die Schieberegister 1436 gleich dem Schieberegister 
1435 den gespeicherten Wert um genau so viele Positionen, wie Glieder in den 
Ketten geloscht wurden, in Richtung des niederwertigen Bits. 1st nach dieser 
15 Operation der Inhalt eines Schieberegisters gleich Null, da das PBIT uber das 
niederwertigste Bit hinausgeschoben wurde, bedeutet dies, dass die vormals 
referenzierte Konf iguration ge!6scht wurde. 

Liefert 1434 fur einen eingetrof f enen Trigger 1431 den Wert Null am Ausgang 
20 1433, ist eine Konfigurationsaufforderung an d[ie Konfi'gurationseinheit zu 
send en, um die f ehlende Konf iguration zu laden oder ggf . auch ein 
Fehlerstatus an die Konfigurationseinheit zu melden. 

Die Obersetzung der eingehenden Trigger 1431 nach 1437 in 1432 kann nach 
25 mehreren Prinzipien erfolgend, die einzeln oder gemeinsam angewendet werden 
kOnnen, beispielsweise : 

1. Dekoder entsprechend der Funktion eines 74LS148 

2. Round-Robin Arbiter (vgl. PACT10) 

3. Lookup-Tabelle (vgl. PACT10) 

30 Prinzipiell kann die Obersetzung, dem in PACT10 beschriebenen Verfahren 
entsprechen (Round-Robin-Arbiter, LDT1) . 

Fehlt eihe Obersetzungsvprschrif t, beispielsweise bei der Anwendung von 
Lookup-Tabellen, ist eine Konfigurationsaufforderung an die 
Konfigurationseinheit zu senden, um die f ehlende Konf iguration zu laden oder 
35 ggf. auch ein Fehlerstatus an die Konfigurationseinheit zu melden. 

Eine weitere wesentliche Funktion des Konf igurat ions stacks nach Figur 14 ist 
das Seguenzen uber Konf igurationen, was bedingte und unbedingte Sprunge 
innerhalb des Speichers 1401 bedeutet. Daher ist auch diese Funktion 
40 detailliert in Figur 14b beschrieben. 

Ein Befehlsdekoder (1462) erkennt bedingte und unbedingte Sprungbefehle in 
Konfigurationsworten (1402) beim Iiesen aus dem Speicher 1401. Einem 
Sprungbefehl ist als Rons tan te die relative Sprungadresse zur aktuellen 
45 Position zugeordnet, die vom Befehlsdekoder dekodiert und ausgegeben wird 
(1463). Je nach Sprungrichtung ist der Wert positiv oder negativ. 
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Weiterhin ist als Kerns tan te e in Vergleichswert (1469) mit den eintref fenden 
Triggern oder den Statusflags der PAS, beispielsweise die ALU-Flags zero, 
carry, negative, overflow, etc. oder die Speicher-Flags. full, empty, etc, 
angegeben, in Abhangigkeit des sen bedingte Sprunge durchgefunrt werden. Diese 
5 wird an eine Vergleichs einheit 1464 uberraittelt, die den Wert mit den Flags . 
(146S) und/oder Triggern, die von dem Augang Obersetzungs- und 
Zuweisungseinrichtung (1437) und/oder direkt von dem Bussystem 0105 stammen, 
verglichen . 

10 Eine Steuereinheit (1466) generiert in Abhangigkeit des Befehles (bedingter 
oder unbedingter Sprung = "Type') und des Vergleichs ergebnisses die 
Ansteuerung fur den Lesezeiger (1405) wie folgt: 

Unbedingter sprung: Generiere "Set", urn neue Adr esse nach 1405 zu laden; 
Bedingter Sprung, Vergleich erfullt: Generiere "Set*, urn neue Adresse nach 
15 1405 zu laden; 

Bedingter Sprung, Vergleich nicht erfullt: Generiere "Count', urn Adresse des 
nachfolgenden Befehles in 1405 zu berechnen. 

Das Setzen einer neuen Adresse geschieht durch Aufaddieren (1468) der 
20 relativen Sprungadresse (1463) zum aktuellen Wert von 1405. Ober einen 

Multiplexer (1467), der zwischen der aufaddierten neuen Adresse und der von 
1415 generiert en Startadresse von Konf igurationen (1461) ausw&hlt, wird die 
neue Adr ess bei Anliegen von •Set" in den Lesepo inter 1405 geschrieben. 

25 Die Arbeit sweise des Konf igur at ions tacks macht die Verwendung von 

Konfigurationseinheiten (CT) wie aus PACT10 und PACT 17 bekannt weitgehend 
oboslet, vielmehr 1st eine verteilte, parallele CT durch die 
Konf igurationss tacks entstanden. 

Zwei Aufgaben der CT konnen dabei jedoch bei einer solchen Einheit 
30 verbleiben: 

1. Das Laden der Konf igurationen aus einem Speicher, der chipintern oder 
-extern implementiert sein kann, als f luchtiger oder nicht fluchtiger 
(ROM, EPROM, EEPROM, Flash-RDM, etc) Speicher ausgestaltet sein kann 

35 und/oder ein Massenspeicher sein kann. Dies kann nunmehr durch einen 

einfachen Mikrokontroller erfolgen, der Daten an die PAEs sendet und 
auf die zuruckgemeldete Quittierung reagiert. Beispielsweise kann 
bevorzugt die Einheit aus PACT05 als Mikrokontroller bzw. der in 
PACT05 beschriebene Algorithmus eingesetzt werden. Das Laden mufi nicht 

40 mehr zwingend aktiv geschehen, sondern es ist ausreichend, wenn eine 

Einheit vorhanden ist, die auf das Konf igurationsanforderungskommando 
das Hereinholen der neuen Konfigurationsdaten in die jewel lige PAE 
bzw. deren zugeordneten Konfigurationsspeicher veranlasst. Dies kann, 
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etwa bei den vorstehend diskutierten 1/O-PAEs auch jene PAE selbst 
seih, die derzeit : heue i Konf igurationsdaten benStigt. 

2 . Die verbleibende Resteinheit kann verwendet werden, um 
5 sicherzustellen, dass Rekonf igurationstrigger (WOT) in einer 

bestimmten Reihenfolge sortiert durch das Array laufen und/oder 
vorgeladene Konf igurationen in der erforderlichen Reihenfolge 
abgearbeitet werden und/oder noch nicht geladene, aber bend tig te 
Konf igurationen wie erforderlich angefordert und /oder geladen werden. 

10 Diese Rekonf igurationstriggerpriorisierung kann dazu verwendet werden, 

zu Priorisieren, auf welchen Rekonf igurationsanf or derungstrigger 
zuerst reagiert werden soil. Dies stellt die konf liktfreie Abarbeitung 
unterschiedlicher, mdglicher Konf igurationen sicher, indem lediglich 
festgelegt wird, welcher Trigger zunachst durch das Array l&uft. Wenn 

15 ein solcher Trigger eine bestimmte PAE betrifft, die auf diesen 

Trigger reagieren soil, wird sie sich dies merken, um dann als 
nachstes auf diesen Trigger reagieren zu konnen, sobald sie 
rekonf iguierbar ist. Es sei erwahnt, dass bevorzugt die einzelne Zelle 
oder ein Zellgebilde oder dergl. riicht nur jene Trigger vormerkt, die 

20 unmittelbar nachfolgend abzuarbeitende Konf igurationen betreffen, 

sondern dass auch alle weiteren oder wenigstens mehrere, von dieser 
Zelle kthif tig abzuarbeitenden Konf igurationen in ihrer Reihenfolge 
abgelegt werden kflnnen und/oder sollen, so dass jede Zelle oder 
Zellgruppe die Information aus den Triggervektoren erhait und behait, 

25 die sie zukttnftig und/oder aktuell betrifft. Damit wird die Filroo- 

Funktion der f ruber en CT Qberf lussig und durch den Zeitverlauf der 
Triggervektoren im wesentlichen ersetzt. 

3 . Sof ern nur ein Rekonf igurations trigger verwendet wird, sind keine 
30 besonderen MaSnahmen erforderlich. Wenn mehrere 

Rekonf igurations trigger (WCT) auftreten kOnnen, mussen diese ohne 
zeitliche tJberlagerung, also nacheinander in fester Reihenfolge und 
kreuzungsfrei durch das Array laufen, um Deadlocks zu verhindem. 

35 Die kann durch das in Figur 16 dargestellte Verfahren sichergestellt werden, 
bei welchen durch Routing -Ma ftnahm en fur eine korrekte zeitliche Weiterleitung 
von WCT zu sorgen. Von einer zentralen Instanz (1603) werden mehrere WCT fur 
verschiedene PAEs (1601) generiert, die jedoch zeitlich aufeinander 
abgestimmt sein sollen. Die unterschiedlichen Entfernungen der 1601 in der 

40 Matrix ftthren zu unterschiedlichen Laufzeiten, bzw. Latenzzeiten. Dies wird 
in dem vorliegenden Beispiel durch das geeignete Einsetzen von Pipelinestuf en 
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(1602) durch den, dem Compiler zugeordneten Router, erreicht (vgl. PACT13). 
Die* sich. dadurch ergebenden Latenzen sind mit dl-d5 angegeben. Es ist 
ersichtlich, da& in Ricntung des WCT-Flusses (1604) in jeder Stufe (Spalte) 
dieselben Latenzen auftreten. Beispielsweise ware 1605 nicht notwendig, da 
5 die Entfemung von 1606 von 1603 sehr gering ist. Da aber fur 1607 und 1608 
je ein 1602 au£grund der durch die langere Distanz entstehenden Laufzeit 
eingefttgt werden muE, wird 1605 zum Abgleich der Laufzeit notwendig. 
Die zentrale Instanz 1603 ninnnt von den PAEs eingehende 

Rekonfigurationstrigger (1609) auf und priorisiert diese r um sie dann jeweils 
10 einzeln und nacheinander als WCT an das Array aus PAEs zu senden. Mit 

anderen Worten sendet eine PAE, die einen Rekonfigurationstrigger generiert, 
di es en nicht direkt an andere PAEs weiter, sondem ausschlieSlich an die . 
zentrale Instanz 1603, 

15 Die zentrale Instanz spei chert eingehende Trigger und priorisiert diese. Dazu 
kann bevorzugt das aus PACT10 bekannt Verfahren des SCRR-ARB verwendet 
werden, wie es in Figur 8 PACT10 ausfflhrlich beschrieben ist. 
Saintliche erwalinten PACT-Schutzrechte sind zu Of f enbarungszwecken 
vollumfanglich eingegliedert . 
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Titel: 
5 Patentanspruche 

1. Zellementefeld zur Datenverarbeitung mit Funktionszellen zur Ausf tthrung 
algebraischer und/oder logischer Funktionen und Speicherzellen, um 
Information zu empfangen, abzuspeichern und/oder auszugeben, dadurch 

10 gekennzeichnet, dafi von den Punktionszellen eine Steuerverbindung- zu den 

Speicherzellen geftthrt 1st. 

2 . Zellementefeld nach dem vorhergehenden Anspruch , dadurch gekennzeichnet, 
dafi ein Prozessor, Coprozessor und/oder Microcontroller mit einer 

15 Vielzahl in Funktion und/oder Vemetzung rekonf igurierbarer und/oder 

vorgebbarer Einheiten wie Punktionszellen und/oder Speicherzellen bildet. 

3. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 
gekennzeichnet , daS die Punktionszellen als arithmetische Logikeinheiten 

20 gebildet sind. 

4. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
da£ die arithmetischen Logikeinheiten als erweiterte ALUs gebildet sind. 

25 5. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 

gekennzeichnet, da£ die Speicherzellen zur fluchtigen und/oder nicht 
flttchtigen Datenspeicherung ausgebildet sind. 

6. Zellementefeld nach einem der vorhergehenden Ansprtiche , dadurch 
30 gekennzeichnet, dafi die Speicherzellen zur Abspeicherung von zu 

verarbei tenden Da ten und/oder von zu verarbeitenden Programmschritten 
ausgebildet sind. 

7. Zellementefeld zur Datenverarbeitung, dadurch gekennzeichnet, daS die 
35 Speicherzellen dazu ausgebildet sind, abgespei chert e Informationen auf 

Ansteuerung der sie steuernden Funktionszelle direkt und/oder indirekt 
auf einen zur Funktionszelle fuhrenden Bus zu geben. 

8. Zellementefeld nach einem der vorhergehenden Ansprtiche/ worin zumindest 
40 einer Speicherzelle und/oder Funktionszelle Register zugeordnet sind, 

insbesondere ein Backward -Register, welches im Informationsweg zwischen 
Speicherzelle und Funktionszelle angeordnet ist. 

9 . Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 

45 gekennzeichnet, dafi die Speicherzelle dazu angeordnet ist, Informationen 

von der sie steuernden Funktionszelle, einer Eingabe-Ausgabe-Zelle 



60 



WO 03/036507 



PCT/EP02/10572 



10 



und/oder einer sie nicht steuemden Zelle mit arithmetischer Logikeinheit 
zu empfangen. - . 

.10. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 
gekennzeichnet, dafi der Funktionszellen-Speicherzellen-Kombination 
zumindest ein Ein-Ausgabe-Mittel zugeordnet 1st, urn Informationen an eine 
ex t erne Einheit und/oder eine andere Funktionszelle, Funktionszellen- 
Speicherzellen-Kombination und/oder Speicher zelle zu senden und/oder von 
dieser zu empfangen. 

11. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
daS das Ein-Ausgabe-Mittel gleichfalls zum Empfang von Steuerbefehlen 
aus der FunJctionszelle ausgebildet 1st. 

15 12. Zellementefeld nach einem der vorhergehenden Anspruche, dadurch 

gekennzeichnet, dafi die Steuerung dazu ausgebildet ist, zumindest 
einige, bevorzugt alle der nachfolgenden Befehle zu ubertragen und/oder 
die Speicher zelle bzw. Eingabe/Ausgabe-Zelle dazu ausgebildet ist, die 
folgenden Befehle zu dekodieren: DATA WRITE/READ, ACRES S POINTER 

20 WRITE/READ, PROGRAMMPO INTER WRITE/READ, PROGRAMMPO INTER INCREMENT, 

STACKPOINTER WRITE/READ, vorgenannte Befehle jeweils insbesondere fttr 
internen und/oder externen Zugriff , PUSH, POP, OPCODE, FETCH. 

13. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 

25 gekennzeichnet, dafi die Funktionszelle als alleiniger Master auf die 

Steuerverbindung und/oder das als Steuerungsverbindung dienende 
Bussegment zugreifen kann. 

14. Zellementefeld zur Datenverarbeitung nach einem der vorhergehenden 
30 Ansprtiche, dadurch gekennzeichnet, dafi die Funktionszelle zumindest 

einer von Speicher zelle und Ein-Ausgabezelle benachbart angeordnet ist. 

15. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 
gekennzeichnet, dafi die Zellelemente multidimensional angeordnet sind, 

35 insbesondere matrixartig, wobei die Funktionszelle und/oder die 

benachbarte Speicher- bzw. Ein-Ausgabezelle aus einer oberen Reihe Daten 
empfangen und in eine untere Reihe Daten ausgeben kann, wobei in einer 
Reihe Busse vorgesehen sind und die Funktionszelle und zumindest eine 
Speicher- und/oder Ein-Ausgabezelle in ein und derselben Reihe liegen. 

40 

16. Verfahren zum Betrieb eines Zellelementef eldes, insbesondere 
multidimensional en Zellelementef eldes mit Funktionszellen zur Ausfuhrung 
algebraischer und/oder logischer Funk t ion en und 

Informatlonsbereitstellungszellen, insbesondere Speicher zell en und/oder 
45 Ein-Ausgabezellen zum Empfangen und/oder Ausgeben von Informationen 

und/oder Speichem derselben, dadurch gekennzeichnet, dafi zumindest eine 
der Funktionszellen Steuerbefehle an zumindest eine 
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Informationsbereitstellungszelle ausgibt, dort ira Ansprechen auf die 
Steuerbefehl information f ur die Funktionszelle verarbeitet wird und die 
Funktionszelle dazu ausgebildet 1st, eine weitere Da tenverarbei tung im 
Ansprechen auf aus der Informationsbereitstellungszelie bereitgestellte 
5 Information durchzuftthren, urn so sequenzerartig Da ten zu verarbeiten. 

17. Verfahren nach einem der vorhergehenden Ansprtlche , dadurch 

gekennzeichnet, da£ die Funktionszelle dazu ausgebildet ist/ zumindest 

einige der Steuerbef ehle 
.10 OPCODE FETCH, 

DATA WRITE INTERN, 

DATA WRITE EXTERN, 

DATA READ INTERN, 

DATA READ. EXTERN, 
15 ADRESSPOINTER WRITE INTERN, 

ADRESS POINTER WRITE EXTERN, 

ADRESSPOINTER READ INTERN, 

ADRESSPOINTER READ EXTERN, 

PROGRAMMPO INTER WRITE INTERN, 
20 PROGRAMMPO INTER WRITE EXTERN, 

PROGRAMMPO INTER READ INTERN, 

PROGRAMMPOINTER READ EXTERN, 

STACKPOINTER WRITE INTERN, 

STACKPOINTER WRITE EXTERN, 
25 STACKPOINTER READ INTERN, 

STACKPOINTER READ EXTERN, 

PUSH, 

POP, 

PROGRAMMPOINTER INCREMENT 
30 ausgibt und im Laufe Zellementbetriebs zumindest einige, insbesondere 

alle der oben genannten Steuerbef ehle wie erforderlich ausgibt. 



18. Datenverarbeitungsanordnung mit einem multidimensional en 
35 Feld 

in Funktion und/oder Vernetzung konf igurierbarer Zellelemente und 
diesen zugeordneten Konfigurationsvorhaltemitteln zura lokalen 

Konf igurations -Vorhal ten , 

dadurch gekennzeichnet, daS 
40 die Konf igurationsvorhal tend ttel dazu ausgebildet sind, 

zumindest einen Teil der vorgehaltenen Konf igurationen 

nichtfluchtig vorzuhalten. 

19. Datenverarbeitungsanordnung mit einem multidimensional en 
45 Feld 

in Funktion und/oder Vernetzung konf igurierbarer Zellelemente und 
diesen zugeordneten Konfigurationsvorhaltemitteln zum lokalen 
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Konf igurations-Vorhal ten, 
dad.ur c h gekennzeic h n e t , d a S 
die Konfigurationsvorhaltemittel dazu ausgebildet sind, 
alle vorgehalteneh Konf igurationen 
5 nichtflttchtig vorzuhalten. 

20. Datenverarbei tungsanordnung nach einem der vorhergehenden 
Datenverarbei tungsanordnungsansprache, dadurch gekennzeichnet, dafi die 
Punktion grobgranular konf igurierbar ist. . 

10 .. 

21. Datenverarbei tungsanordnung nach einem der vorhergehenden 
Datenverarbei tungsanordnungsansprache, dadurch gekennzeichnet, dafi die 
Vemetzung grobgranular konf igurierbar ist. 

15 22 . Datenverarbei tungsanordnung nach einem der vorhergehenden 

Datenverarbei tungsanordnungsansprttche, dadurch gekennzeichnet, dafi als 
Zellelemente zumindest eines von ALUs, BAlUs, RAM-Zellen, I/O-Zellen, 
LogiblOcken vorgesehen sind. 

20 23. Datenverarbei tungsanordnung nach einem der vorhergehenden 

Datenverarbei tungsanordnungsansprache, dadurch gekennzeichnet, dafi jedem 
Zellelement ein eigenes Konfigurationsvorhaltemittel zugeordnet ist. 

24. Datenverarbei tungsanordnung nach einem der vorhergehenden 

25 Datenverarbei tungsanordnungsansprache, dadurch gekennzeichnet, dafi die 

Konfigurationsvorhaltemittel dazu ausgebildet sind, eine Vielzahl von 
Konf igurationen vorzuhalten. 

25. Datenverarbei tungsanordnung nach einem der vorhergehenden 

30 Datenverarbei tungsanordnungsansprache, dadurch gekennzeichnet, dafi 

mehrere fest vorgegebene nichtflttchtige Konf igurationen im 
Konfigurationsvorhaltemittel vorgegeben sind. 

26. Datenverarbei tungsanordnung nach einem der vorhergehenden 

35 Datenverarbei tungsanordnungsansprache, dadurch gekennzeichnet, dafi die 

Anordnung dazu ausgebildet ist, eine wechselnde einer Vielzahl von 
vorgehaltenen Konf igurationen zu verwenden, insbesondere im Wege der 
Wave-Rekonfiguration oder des lokalen Sequencing. 

40 27. Datenverarbei tungsanordnung nach einem der vorhergehenden 

Datenverarbei tungsanordnungsansprache, dadurch gekennzeichnet, dafi bei 
einigen Zellen im Betrieb mit veranderlichen Konf igurationen versehbare 
Konfigurationsvorhaltemittel vorgesehen sind. 

45 28. Datenverarbei tungsanordnung nach einem der vorhergehenden 

Datenverarbei tungsanordnungsansprache, dadurch gekennzeichnet, dafi als 
Konfigurationsvorhaltemittel zunmindest eines aus ROM, EPROM, EEPROM, 
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Flash- Speicher, Fuse-, Antifuse-programmierbare Speichermittel und/oder 
in insbesondere in oberen Lagen einer Siliziumstruktur . fest vorgesehene 
Speichermittel gewahlt sind. 

Verfahren zur Herstellung einer dedizierten 
Datenverarbei tungsanordnung , dadurch gekennzeichnet, dafi ein 
multidimensional es Feld mit in Funktion und/oder Vernetzung 
konf igurierbaren Zellelemente und diesen zugeordneten 
Konfigurationsvorhaltemitteln zum lokalen Konf igurat ions -Vorhal ten 
vorgegeben wird, bestimmt wird, welche Konf igurationen in diesen 
vorzuhalten sind, und dann nichtf luchtige Konf igurat ionsvorhaltemittel 
so vorgesehen werden, daB sie zumindest einen Teil der vorgehaltenen 
Konf igurationen nichtf litchtig vorhal ten. 

15 30. Verfahren nach dem vorhergehenden Datenverarbei tungsahordnungsanspruch, 
dadurch gekennzeichnet, da£ von einem zur lauf zeitrekonf igurierbaren 
multidimensional en Feld ausgegangen wird. 

Verfahren nach dem vorhergehenden Datenverarbei tungsanordnungsanspruch, 
dadurch gekennzeichnet, da£ zunachst von einem zur 
lauf zeitrekonf igurierbaren multidimensionalen Feld mit 
Rekonf igurationsbeschaltung ausgegangen wird und dann fur 
Rekonf igurat ion nichtbenOtigte Felder weggelassen werden. 
Datenverarbei tungsanordnung, insbesondere nach einem der vorhergehenden 
Ansprttche, insbesondere Prozessor, mit einem Feld aus zur Lauf zeit in 
Funk t ion und/oder Vernetzung datenverabeitenden rekonf igurierbaren 
Zellen, denen Speicher und eine Sequenzersteuerung zugeordnet 1st, 
dadurch gekennzeichnet, dafi die Steuerung der art ausgebildet ist, daB 
sich ein vollstahdiger und/oder limitierter Befehssatz ergibt. 

33;. Datenverarbei tungsanordnung, insbesondere riach einem der 

vorhergehenden Ansprflche, insbesondere Prozessor, mit einem Feld aus 
zur Lauf zeit in Funktion und/oder Vernetzung datenverabeitenden 
35 rekonfigurierbaren Zellen, mit einer ALU oder anderen logischen 

VerknQpf ungsbeschal tung und dieser zugeordnetem, insbesondere 
integriertem Speicher, dadurch gekennzeichnet, dafi der Speicher in 
einer anderen Halbleiter-Lage, insbesondere oberhalb der ALU oder 
anderen logischen Verknupf ungsbeschal tung angeordnet ist. 

40 

34. Datenverarbei tungsanordnung, insbesondere nach einem der 

vorhergehenden Ansprttche, insbesondere Prozessor, mit einem Feld aus 
zur Lauf zeit in Funktion und/oder Vernetzung datenverabeitenden 
rekonfigurierbaren Zellen, von denen einige Speicher zwecken dienen, 
45 dadurch gekennzeichnet, da& diese Zellen dazu ausgebildet sind, eine 

MMD und/oder DMA - Funktion zu realisieren. 
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35 . Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Ansprttche, insbesondere Prozessor, mit einem Peld aus 
zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 

5 rekonf igurierbaren Zellen, dadurch gekennzeichnet, dafi wenigstens 

eine, bevorzugt zumindest einige, insbesondere bevorzugt nicht alle, 
Zellen eine Eingangs/Ausgangs funktion realisieren und bevorzugt 
zugleich eine ALU oder anderen logischen Verkntlpfungsbeschal tung zur 
Datenverarbeitung und/oder -veranderung aufweisen, wobei insbesondere 

10 Mittel vorgesehen sind, um jedem EinganGs- und/oder Ausgangskanal eine 

definierte Adresse zuzuordnen, und/oder wobei 
Senderidentifkationsmittel vorgesehen sind. 

36. Datenverarbeitungsanordnung, insbesondere nach einem der 

15 vorhergehenden Ansprttche, insbesondere Prozessor, mit einem Feld aus 

zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 
rekonf igurierbaren Zellen, dadurch gekennzeichnet, dag zumindest 
einige, bevorzugt nicht alle, Zellen f eingranulare FPGA-Strukturen 
aufweisen, wahrend andere Zellen grobgranulare Strukturen aufweisen. 

20 

37. Datenverarbeitungsanordnung nach dem vorhergehenden Anspruch, wobei 
eine Konfigurationseinheit zur schnellen Rekonfiguration der Zellen 
vorgesehen ist, dadurch gekennzeichnet, dafi die Konfigurationseinheit 
nur zur Konf iguration der grobgranularen und/oder der Nicht-FPGA- 

25 Zellen beschaltet ist. 

38. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Ansprttche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 

30 rekonf igurierbaren Zellen zur Verarbeitung von Daten mit einer hoheren 

Bitbreite, dadurch gekennzeichnet, dafi die Zellen dazu ausgebildet 
sind, wahlweise Daten mit einer h6heren Bitbreite oder Daten mit 
geringerer Bitbreite zu verarbeiten, wobei dann mehrere Daten mit 
geringerer Bitbreite simultan verarbeitbar sind, insbesondere nach Art 

35 eines SIMD-Rechenwerkes . 



Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Ansprttche, nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi zur Zelle bin oder von dieser weg fuhrende Busse 
teilbar sind, insbesondere um mehrere DatenstrOme mit geringerer 
Bitbreite als der in der Zelle maximal bearbeitbaren Bitbreite 
unabhangig welter lei ten und/oder empfangen zu konnen. 

40. Datenverarbeitungsanordnung, insbesondere nach einem der 
45 vorhergehenden Ansprttche, nach dem vorhergehenden Anspruch, dadurch 

gekennzeichnet, dafi die Busverwaltung lokal in der Zelle erfolgt. 



39. 

40 
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41. Datenverarbeitvmgsanordnung insbesondere nach einem der vorhergehenden 
Ansprtlche, dadurch geJcennzeichnet , da£ einer PAE ein Speicher zur 
Sequenzerrealisierung zugeordnet 1st und die Adressbusse als 
Teiladresbusse aufteilbar sind. 



5 



42. Da t enver arbe i tungsanor dnung insbesondere nach einem der vorhergehenden 
Ansprtlche, dadurch gekennzeichnet, daS einer PAE ein Speicher zur 
Sequenzerrealisierung zugeordnet ist und eine Anordnung vorgesehen . 
10 ist, urn. bei Zugriff auf eine Speichers telle sowohl Informationen 

betref fend die Adresse einer Speichers telle fur den nachsten 
£>peicherzugriff zu bestimmen als auch Daten und/oder Befehle zu 
ermitteln. 

15 
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